Словарь в excel как сделать

Пошаговое руководство создания частотного словаря с помощью MS Word и MS Excel:

Транскрипт

1 Пошаговое руководство создания частотного словаря с помощью MS Word и MS Excel: 1. ПОДГОТОВКА ТЕКСТА В MS WORD: Шаг 1. Копируем текст в MSWord, избавляемся от всех знаков пунктуации (в том числе от пробелов) и разносим каждое слово на отдельную строку с помощью инструмента Заменить (команда Ctrl+H): Для поиска/замены знаков препинания необходимо включить опцию «Подстановочные знаки» (включается по кнопке «Больше >>»). Не все знаки пунктуации можно перечислять «как есть», некоторые из них сами являются командой для функции подстановочных знаков, поэтому их нужно перечислять через обратный слеш ! или?. Лучше поставить перед каждым знаком. Если нужно, скопируйте:[.,:;»()!? -] Обратите внимание, что если оставить знак дефиса в этом перечне, то такие слова, как «когда-нибудь» будут разделены на два отдельных слова (как и предлагает Л.Н. Засорина в своем частотном словаре). Замена производится на Знак Абзаца (кнопка «Специальный» или команда ^p). Шаг 2. После того, как знаки убраны, а каждое слово на отдельной строке, выделяем весь текст (команда Ctrl+A) и командой Shift+F3 приведем все слова к единому регистру (текст получится более стройным, если все слова будут с маленькой буквы).

2 2. ОБРАБОТКА В MS EXCEL: Затем следует избавиться от пустых строк с помощью того же инструмента замены (Ctrl+H), только теперь Подстановочные знаки должны быть отключены. Чтобы убрать пустые строки нужно Найти каждые два Знака абзаца (^p^p) и Заменить на один такой Знак абзаца (^p). За один проход по кнопке Заменить всё количество пустых строк сократится только вдвое. Замену следует производить до тех пор, пока пустых строк совсем не останется. Текст готов к дальнейшей обработке в MS Excel. Выделить весь текст Ctrl+A, вырезать Ctrl+X. Шаг 3. Полученный список следует вставить в MS Excel в ячейки A2 и С2. Первый столбец для словоупотреблений, второй для их грамматических категорий, а третий слова, приведенные к их исходной форме (леммы). Назовите их соответственно:

3 Шаг 4. Лемматизация для столбца С и определение для каждого словоупотребления его грамматической категории в столбце B производится самостоятельно (при этом MS Excel помогает с автозаполнением слов, упомянутых в списке выше). Шаг 5. Для создания частотного словаря, выделим столбцы с грамматическими категориями и леммами, проведя мышью по их буквам: B и C. На вкладке Вставка слева выбираем Сводная таблица. Рекомендуется не менять предложенные параметры, сводная таблица будет создана на новом листе: Для заполнения таблицы 1 из пояснения к Лабораторной работе 3 включите поле Грамматических категорий и перетащите его в область Σ Значения. Затем в столбце C рассчитайте относительную частоту грамматических категорий.

4 Шаг 6. Для наглядности простройте диаграмму из данных A и C (несмежные диапазоны выделяются с прижатой клавишей Ctrl). Диаграмму можно будет вставить в лабораторную работу для каждого из отрывков (см. рис. ниже). Шаг 7. Для заполнения таблицы 2 из пояснения к Лабораторной работе 3 включите опцию Леммы чтобы получить следующую картину (Названия строк должны стоять именно в таком порядке Грам. кат. выше, чем Лемма): Чтобы отсортировать глаголы и другие части речи не по алфавиту, а по частоте использования, станьте на ячейку с первым значением (на рис. это ячейка B5) и нажмите сортировку (от Я до А). Кнопка сортировки находится на Главной вкладке справа (рядом с опцией Найти и выделить).

5 Шаг 8. Создайте таблицу 2 и заполните ее по следующему принципу: в колонку Частота:>=2 следует копировать только те строки, в которых перечислены слова, упомянутые более 1 раза в произведении. В колонку Частота 1 остальные, уникальные леммы. Существительные Частота: >=2 Частота: 1 клён 3 береза, верба, деревня, дом, дорога, доска, жена, лето, нога, метель 2 песня, попойка, скромность, сосна, сторож, сугроб Глаголы Частота: >=2 Частота: 1 выйти 2 опасть 2 встретить, дойти, казаться, нагнуться, обнимать, погулять, приметить, приморозить, распевать, стать, стоять, увидеть, услышать, утонуть, утратить и т.д. Частота: >=2 Частота: 1 Если со вставкой в колонку Частота:>=2 вопросов обычно не возникает, то при вставке уникальных лемм следует учитывать, что при копировании из MS Excel в ячейку таблицы MS Word вставляется вложенная таблица. Ее следует преобразовать в текст на вкладке Макет, либо изначально вставлять скопированный текст через Специальную вставку. или или Отсортируйте строки уникальных лемм по алфавиту (от А до Я). Затем произведите замену Знаков Абзаца ^p на запятую с пробелом:

Словарь терминов Excel

Адрес ячейки является основным элементом ссылки на ячейку. С помощью адреса можно найти любую ячейку в рабочей книге Excel. Адрес состоит из имени столбца и номера строки (например, В2 — это ячейка, которая находится на пересечении столбца В и строки 2).

Читать еще:  Как сделать продолжение таблицы в excel?

В каждую ячейку листа пользователь может ввести данные. Перед вводом данных ячейка должна быть активизирована. Ячейка активизируется в результате щелчка на ней или вследствие размещения на ней указателя ячейки с помощью клавиш управления курсором или комбинации клавиш.

Буфер обмена — это временная память, предоставляемая в распоряжение пользователя операционной системой Windows. С помощью буфера данные переносятся в другое приложение без импортирования. Данные в буфере обмена в зависимости от их источника могут быть представлены в различных форматах.

Выделение применяется для указания того, какие ячейки следует использовать при выполнении той или иной операции. Выделенная ячейка заключается в рамку, а выделенный диапазон ячеек отображается инверсно.

Выделенный диапазон ячеек

Выделенный диапазон ячеек состоит из нескольких маркированных ячеек рабочего листа Excel, которые будут использоваться при выполнении операций до отмены маркировки.

Имена, присвоенные ячейкам и диапазонам, могут использоваться в адресах и ссылках, а также вместо адресов в формулах.

В Excel рабочие листы, листы диаграмм и макросов объединены в единый документ — книгу. По умолчанию каждая книга состоит из трех рабочих листов. С помощью контекстного меню ярлычков листа в книгу можно вставить дополнительные или удалить ненужные листы. Все листы рабочей книги Excel сохраняются в одном файле.

Контекстное меню содержит команды, которые предназначены для обработки только активного объекта и связаны с текущей операцией. Контекстное меню открывается в результате нажатия правой кнопки мыши или клавиатурной комбинации [Shift+F10].

Ввод данных и вычисления выполняются на листах книги Excel. Лист (таблица) разделен на строки и столбцы. Он состоит из 256 столбцов и 65536 строк, то есть содержит 16777216 ячеек. Для различных форм представления данных используются листы разных типов.

Под связью следует понимать связывание нескольких рабочих листов и листов диаграмм. Связь устанавливается в результате задания внешней ссылки и играет важную роль в тех случаях, когда значения в одной таблице зависят от значений в другой таблице

Ссылка является основным элементом при выполнении вычислений с использованием нескольких ячеек. Например, если нужно определить сумму значений двух ячеек и поместить результат в третью, в формуле указываются ссылки на ячейки, в которых находятся слагаемые. Основным элементом ссылки Excel является адрес ячейки.

Таблицей принято считать совокупность данных, упорядоченных по строкам и столбцам. Таблица Excel может содержать формулы, ссылки на другие таблицы, а также другие объекты, например отформатированные ячейки, предназначенные для ввода данных, диаграммы, рисунки и т. д.

Указатель ячейки (табличный курсор)

Указатель ячейки — это рамка, с помощью которой на рабочем листе или листе макросов выделяется активная ячейка . После выделения можно заносить данные в ячейку или использовать ее содержимое при выполнении операций. Указатель ячейки перемещается с помощью мыши или клавиш управления курсором.

Включает назначение шрифта, оформление ячеек цветом и рамками (стилевое форматирование), а также выбор формата значений (числовое форматирование). Стилевое форматирование используют для придания таблице привлекательного внешнего вида, а числовое — для определения метода интерпретации находящихся в ячейке данных.

Ячейка является наименьшей структурной единицей рабочего листа. Может содержать данные в виде текста, числовых значений, формул или параметров форматирования. Чтобы изменить высоту или ширину ячейки в таблице, нужно изменить высоту строки или ширину столбца, В ячейку можно поместить не более 32000 символов. Всего на рабочем листе имеется 16777216 ячеек.

Термины и понятия, вводимые автором

Модуль — законченная электронная таблица небольшого размера, которая имеет вход и выход. Модули предназначены для решения определенных задач, они могут входить как самостоятельный элемент в состав более сложных электронных таблиц. Особенностью модуля является возможность его перемещения, копирования и вставки в другие электронные таблицы.

Вход — ячейка модуля (или некоторой электронной таблицы), в которую заносятся данные, подлежащие последующей обработке. Данные могут заноситься с клавиатуры, а также из других ячеек электронной таблицы. В одном модуле может быть несколько входов.

Выход — ячейка модуля (или некоторой электронной таблицы), в которой размещается результат расчетов данного модуля (или некоторой электронной таблицы). В одном модуле может быть несколько выходов. Выход одного модуля может быть связан с входом другого, если второй модуль использует результаты первого модуля для дальнейших расчетов. Эта связь реализуется в виде ссылки из ячейки входа второго модуля на ячейку, служащую выходом первого модуля.

Словарь терминов

Адрес ячейки является основным элементом ссылки на ячейку. С помощью адреса можно найти любую ячейку в рабочей книге. Адрес состоит из имени столбца и номера строки (например, В2 — это ячейка, которая находится на пересечении столбца В и строки 2).

Активизация

В каждую ячейку листа пользователь может ввести данные. Перед вводом данных ячейка должна быть активизирована. Ячейка активизируется в результате щелчка на ней или вследствие размещения на ней указателя ячейки с помощью клавиш управления курсором или комбинации клавиш.

Читать еще:  Как сделать ячейку фиксированной в excel?

Буфер обмена

Буфер обмена — это временная память, предоставляемая в распоряжение пользователя операционной системой Windows. С помощью буфера данные переносятся в другое приложение без импортирования. Данные в буфере обмена в зависимости от их источника могут быть представлены в различных форматах.

Выделение применяется для указания того, какие ячейки следует использовать при выполнении той или иной операции. Выделенная ячейка заключается в рамку, а выделенный диапазон ячеек отображается инверсно.

Выделенный диапазон ячеек

Выделенный диапазон ячеек состоит из нескольких маркированных ячеек рабочего листа, которые будут использоваться при выполнении операций до отмены маркировки.

Имена, присвоенные ячейкам и диапазонам, могут использоваться в адресах и ссылках, а также вместо адресов в формулах.

В Excel рабочие листы, листы диаграмм и макросов объединены в единый документ — книгу. По умолчанию каждая книга состоит из трех рабочих листов. С помощью контекстного меню ярлычков листа в книгу можно вставить дополнительные или удалить ненужные листы. Все листы рабочей книги сохраняются в одном файле.

Контекстное меню

Контекстное меню содержит команды, которые предназначены для обработки только активного объекта и связаны с текущей операцией. Контекстное меню открывается в результате нажатия правой кнопки мыши или клавиатурной комбинации [Shift+F10].

Листы книги

Ввод данных и вычисления выполняются на листах книги. Лист (таблица) разделен на строки и столбцы. Он состоит из 256 столбцов и 65536 строк, то есть содержит 16777216 ячеек. Для различных форм представления данных используются листы разных типов.

Под связью следует понимать связывание нескольких рабочих листов и листов диаграмм. Связь устанавливается в результате задания внешней ссылки и играет важную роль в тех случаях, когда значения в одной таблице зависят от значений в другой таблице

Ссылка является основным элементом при выполнении вычислений с использованием нескольких ячеек. Например, если нужно определить сумму значений двух ячеек и поместить результат в третью, в формуле указываются ссылки на ячейки, в которых находятся слагаемые. Основным элементом ссылки является адрес ячейки.

Таблицей принято считать совокупность данных, упорядоченных по строкам и столбцам. Таблица может содержать формулы, ссылки на другие таблицы, а также другие объекты, например отформатированные ячейки, предназначенные для ввода данных, диаграммы, рисунки и т. д.

Указатель ячейки (табличный курсор)

Указатель ячейки — это рамка, с помощью которой на рабочем листе или листе макросов выделяется активная ячейка . После выделения можно заносить данные в ячейку или использовать ее содержимое при выполнении операций. Указатель ячейки перемещается с помощью мыши или клавиш управления курсором.

Форматирование ячеек

Включает назначение шрифта, оформление ячеек цветом и рамками (стилевое форматирование), а также выбор формата значений (числовое форматирование). Стилевое форматирование используют для придания таблице привлекательного внешнего вида, а числовое — для определения метода интерпретации находящихся в ячейке данных.

Ячейка является наименьшей структурной единицей рабочего листа. Может содержать данные в виде текста, числовых значений, формул или параметров форматирования. Чтобы изменить высоту или ширину ячейки в таблице, нужно изменить высоту строки или ширину столбца, В ячейку можно поместить не более 32000 символов. Всего на рабочем листе имеется 16777216 ячеек.

Термины и понятия, вводимые автором

Модуль — законченная электронная таблица небольшого размера, которая имеет вход и выход. Модули предназначены для решения определенных задач, они могут входить как самостоятельный элемент в состав более сложных электронных таблиц. Особенностью модуля является возможность его перемещения, копирования и вставки в другие электронные таблицы.

Вход — ячейка модуля (или некоторой электронной таблицы), в которую заносятся данные, подлежащие последующей обработке. Данные могут заноситься с клавиатуры, а также из других ячеек электронной таблицы. В одном модуле может быть несколько входов.

Выход — ячейка модуля (или некоторой электронной таблицы), в которой размещается результат расчетов данного модуля (или некоторой электронной таблицы). В одном модуле может быть несколько выходов. Выход одного модуля может быть связан с входом другого, если второй модуль использует результаты первого модуля для дальнейших расчетов. Эта связь реализуется в виде ссылки из ячейки входа второго модуля на ячейку, служащую выходом первого модуля.

Составление частотного словаря слов средствами Microsoft Office

Сайт ВИО (vio. *****) – электронный журнал «Вопросы Интернет-образования»

Выдержки из статьи http://vio. *****/vio_28/cd_site/Articles/art_2_3.htm

Составление частотного словаря слов средствами Microsoft Office

Написать эту статью побудили три материала, опубликованные в журнале.

1. Замечательная статья Ирины Алексеевны Морозовой «Коллективное лингвистическое исследование» о составлении частотного словаря букв русского алфавита [1]. На основе этой статьи можно организовать увлекательный урок, внеклассное мероприятие, она может стать основой исследовательской работы. Так что, если у статьи могут быть фанаты, то мы относимся к их числу.

2. Константин Алексеевич Попов «Использование частотных словарей при изучении иностранных языков» [2]. В этой статье рассматривается использование генераторов частотных словарей в учебном процессе.

Читать еще:  Как сделать 2 цифры после запятой excel?

3. «Все на борьбу с рутиной!» Павла Юрьевича Белкина и дальнейшее обсуждение этой статьи, в которой рассматривается проблема поиска и замены символов в MS Word [3]-[5].

Как у нас, так и у учеников, возник вопрос: «А можно ли средствами стандартных программ, без обращений к специальным, составить частотный словарь слов одного или нескольких произведений?»

В результате совместных изысканий появился способ, прямо скажем, не лишенный недостатков, который, однако, работает. Он может служить хорошей иллюстрацией глубокой интеграции офисных программ пакета Microsoft Office и хорошим практикумом для уроков компьютерных технологий.

Как можно использовать частотный словарь? Увлекательный рассказ о статистическом лексическом анализе можно найти по адресу http://euro. svoboda. org/programs/sc/2001/sc.062601.asp. Там же есть и предостережение от излишнего увлечения такими методами.

Итак, наша идея состоит в следующем: удалить из текста все знаки кроме букв русского языка, получив, таким образом, список слов, а затем отсортировать его и, сгруппировав одинаковые слова, подсчитать количество слов в каждой группе.

Далее, собственно, сам способ:

Сначала откроем анализируемый текст в Microsoft Word.

Шаг 1. Уберем из текста точки, запятые, цифры, латинские буквы и… В принципе, избавимся от всего, кроме букв русского алфавита. Это можно сделать с помощью пункта меню ПравкаЗаменить. При поиске необходимо использовать отрицание [!] и подстановочные знаки [А-я]. Запрос на все символы, кроме букв русского алфавита, будет выглядеть так [!А-я]. Заменять будем на пробел, хотя это и необязательно. Можно использовать на любой другой символ, например, @ или специальный символ ^p («символ абзаца»). Нажимаем кнопку Заменить все.

Шаг 2. Убираем из текста лишние пробелы, заменяя двойные на одиночные до тех пор, пока двойные еще встречаются [5].

Шаг 3. Преобразуем весь текст к верхнему регистру ФорматРегистрВСЕ ПРОПИСНЫЕ, предварительно выделив весь текст ПравкаВыделить все.

Шаг 4. Преобразуем текст в таблицу ТаблицаПреобразоватьтекст в таблицу. В качестве разделителя используем пробел. Данная таблица характерна тем, что у нее один столбец и в каждой ячейке стоит отдельное слово.

Шаг 5. Выделяем полученную таблицу и копируем в буфер обмена.

Далее можно воспользоваться одной из двух других знаменитых офисных программ: Microsoft Excel или Microsoft Access.

Шаг 6. Создаем новую книгу Excel.

Шаг 7. В ячейке A1 пишем заголовок: «Частотный анализ слов в произведении «Полтава».

Шаг 8. Вставляем таблицу из буфера обмена, начиная с ячейки A2.

Шаг 9. На отдельном листе создаем сводную таблицу ДанныеСводная таблица. Это ли не повод рассказать ученикам о сводной таблице!

Шаг 10. Нажмите клавишу Поместить в. Мы увидим отчет из слов встречающихся в произведении. Для того чтобы вывести количество вхождений данного слова в текст, достаточно перетащить элемент в сводную таблицу. По умолчанию будет как раз вычисляться количество повторений этого слова, что собственно нам и нужно. Таким образом, мы получили частотный словарь. Далее его можно изменять по своему усмотрению. Изменяя свойства поля можно отсортировать сводную таблицу по убыванию, подсчитать долю слов в произведении, добавить столбец с длиной слов и т. п.

Для Microsoft Access:

Шаг 6. Создаем новую базу данных. В режиме конструктора создаем таблицу «Слова» с полем [Слово].

Шаг 7. Переходим в режим таблицы и Вставляем таблицу из буфера обмена.

Шаг 8. Создаем запрос на выборку, используя групповые операции и функцию Count, подсчитывающую сумму по группе. При необходимости сортируем по нужному полю.

Замечание: можно решить эту задачу только с помощью Word и макросов на языке Visual Basic for Application (VBA), но это не совсем соответствует поставленной задаче. С другой стороны, при таком подходе можно автоматизировать описанные выше действия. Можно также попробовать составить частотный словарь с учетом словоформ, правда, только для английского языка.

Последовательность действий будет примерно такой:

Шаг 1. Удаляем из текста все знаки, кроме букв русского языка.

Шаг 2. Удаляем из текста лишние пробелы.

Шаг 3. Устанавливаем один шрифт для всего текста. Выделяем и переводим в верхний регистр.

Шаг 4. Заменяем пробелы на символ конца абзаца.

Шаг 5. Сортируем по возрастанию.

Шаг 6. Составляем частотный словарь и вычисляем длину слов.

Шаг 7. Преобразуем в таблицу с тремя столбцами.

Шаг 8. Выводим во второй столбец количество вхождений данного слова, а в третий — его длину.

Шаг 9. Добавляем заголовок.

Большинство описанных выше операций можно просто записать в макросы с помощью режима «Запись макроса» (СервисМакросНачать запись).

Пример этих макросов находится в документе Частотный анализ слов_А_С_ Пушкин_ ПОЛТАВА. doc. Для выполнения макросов необходимо установить в пункте меню СервисМакросБезопасность уровень безопасности: «Низкий» или «Средний».

После изменения уровня безопасности — перезапустите MS Word.

Запустите форму my_form, нажав кнопку Составление словаря на панели Частотный анализ.

Если вы хотите, чтобы макросы были доступны для других документов, просто скопируйте их и панель с кнопкой с помощью «Организатора» в шаблон Normal. dot (СервисШаблоны и надстройки…).

Ссылка на основную публикацию
Adblock
detector