На главную страницу

LitFrequencyMeter - программа определения частоты повторения слов и знаков в текстах, литературных произведениях, статьях и документах.

Аннотация: "За 1 час 1 минуту Путин В.В. в последнем Послании повторил слова: "мы" - 60 раз; "Россия" - 33 раза; "нас" - 17 раз; "проблемы" - 11 раз; "я" - 10 раз; "считаю" - 8 раз; "власти" - 5 раз." Прочитав это, мне стало немного жаль тех, кому приходится подсчитывать, с карандашом в руке, такую статистику. Как результат - появилась эта программа. Но, если без шуток, то однажды мне пришлось делать задачку определения некоторых параметров и отображения их в графическом виде, на базе продолжения работы над которой и появилась программа "LitFrequencyMeter".

Программа стала одной из самых популярных программ, опубликованных мной на сайте. Среди последних поступающих просьб на доработку программы, наиболее частыми были просьбы:

  • включить в статистику повторение не только слов и знаков, но и групп слов;

  • адаптировать программу для работы с текстами на английском и других языках;

  • добавить английский интерфейс.

В последней версии программы данные пожелания учтены. Прошу извинить за плохой английский в интерфейсе - всем кто найдёт ошибку в надписях на английском или русском будет выслана программы с исправленной найденной и всеми ранее найденными ошибками и неточностями.

На мой взгляд, программа будет полезна:

  • Тем, кто составляет частотные словари для переводов по различным тематикам на различных языках (в том числе и экзотических при доработке).

  • Литераторам и критикам для анализа своих и чужих произведений.

  • Изучающим иностранные языки, да и перед переводом текста полезно знать натболее часто повторяющиеся слова и группы слов в тексте, чтобы ускорить процесс перевода.

  • Педагогам и студентам литературных учебных заведений.

  • Каждому, чтобы узнать свои слова "паразиты".

  • и т.д., и т.п.

Здесь представлена демоверсия программы, разработанная для широкого круга пользователей. Реальная программа может быть адаптирована автором под конкретные задачи и конкретного пользователя.

В начало

Описание программы

Программа запоминает свои размеры, настройки и установки на момент не аварийного закрытия - при старте их восстанавливает.

Программа выполняет определение частоты повторения слов, знаков и групп подряд идущих слов (от 1 до 6) в текстах, литературных произведениях, статьях.

Программа работает с текстовыми, HTML и Word файлами.

Любой текст, также может быть загружен в программу через буфер обмена Windows.

Ограничений на длину текста нет.

Настройки программы позволяют:

  • настроить выборку для анализа, исключив при необходимости из исходного текста и статистики, знаки, символы, цифры, отдельные слова;

  • задать максимальное число поиска в тексте повторяющихся слов и изменять их без повторной загрузки текста ;

  • создать статистику, отобразив результат по убыванию максимального числа повторений, и, определить для каждого из них число повторений и процент повторений в тексте. Кроме того, определяется процент повторений по нарастанию, что позволяет определить для группы слов их повторяемость в статье (книге, у данного автора).

  • создать статистику, отобразив результат по алфавиту, и, определив для каждого результата число повторений, процент повторений в тексте и процент числа повторений по нарастанию, что позволяет определить для группы близких слов их процент повторяемости.

  • настроить программу на работу с текстами на различных языках.

  • отобразить статистику не только в табличном, но и в графическом виде. Графическое отображение может быть настроено как к отношению единичных слов (знаков) ко всему числу слов (знаков) в тексте, так и к группе наиболее часто повторяющихся слов (знаков).

  • Программа имеет множество настроек, позволяющих приспособить настройки "под себя".

В начало

Заставка программы

Программа при старте отображает заставку программы, которая находится в файле ("zast.jpg") в директории, где и ".exe" файл. Вы легко можете поменять заставку, заменив этот файл или воспользоваться меню View, группа пунктов "Действия по смене заставки" (выполняются последовательно). Кроме того, Вы можете вообще отказаться от показа заставки, поставив галочку в меню "View" - пункт "Не отображать/отображать заставку". Тогда при следующем запуске стартовой будет закладка "Формирование статистики".

lfm01.jpg

Рис.1. Заставка программы (английский интерфейс)

В начало

Закладка "Формирование статистики"

На данной закладке (Рис.2.) имеется возможность выбора что анализировать: данные из файла или из буфера обмена (если туда Вы предварительно поместили текст).

lfm02.jpg

Рис.2. Закладка "Формирование статистики" (русский интерфейс)

Соответственно, при выборе формирования из файла Вы имеете возможность провести анализ не ограниченного по длине текста в форматах (*.doc, *.docx, *.htm, *.html, *.txt).

Для анализа нажмите кнопку "Загрузить из файла", в стандартном диалоге выберите тип файла и имя файла и нажмите "Открыть". Файл будет сохранен в массиве данных и будет показан в окне просмотра. Также файл может быть выбран для просмотра нажатием левой кнопочки кнопочного бара программы и при необходимости скорректирован (корректировка в окне просмотра не предусмотрена). После выполнения корректировки не забудьте вновь загрузить файл, предварительно нажав кнопочку "Очистить". После выбора файла Вам становится доступной кнопка "Отчёт из файла".

Если данные для анализа загружаются из буфера обмена, то становится доступной кнопка "Отчет из окна просмотра". После нажатия одной из ставших доступных кнопок, статистика отобразится в окне просмотра.

С этого момента становится работоспособным все чекбоксы и радио кнопки, что позволяет без повторной загрузки текста менять формат формирования и отображения статистики (по алфавиту или частоте повторения, по предложениям или как сплошной текст, показывать все сочетания слов или только повторённые не менее 2х раз, выбор групп слов. При установке галочки "по 1" в статистику отбираются все слова не исключённые в настройках. При установке галочек "по 2" - "по 6" в статистику попадают повторённые подряд идущие слова по принципу от двух подряд идущих слов до числа слов, где установлена галочка (при галочке "по 4", проверяться на повтор будут 2,3 и 4 подряд идущих слова).

Пример анализа романа А.С. Пушкина "Евгений Онегин" приведен на Рис.3.1 и 3.2:

lfm031.jpg

Рис.3.1, Пример отображения результатов статистики в табличном виде по частоте (английский интерфейс)

lfm032.jpg

Рис.3.2. Пример отображения результатов статистики в табличном виде по алфавиту (русский интерфейс)

На данном примере видно, что часть знаков и слов мы не включили в анализ (из 30138 всего 10290), а именно те знаки, которые перечислены в меню, вызываемом по нажатию кнопки 2 или 3 слева в кнопочном баре (на Рис.4. пункты а и b соответственно).

Кроме того, на закладке "Настройка удаления из статистики

lfm04.gif

Рис.4. Настройки программы " есть возможность исключения из статистики дополнительно слов, предлогов применительно к конкретному языку (Рис.4.1 и 4.2). Это даёт возможность адаптировать программу к любым языкам.

lfm041.jpg

Рис.4.1 Настройки удалений для русского языка

lfm042.jpg

Рис.4.2 Настройки удалений для английского языка

В начало

Закладка " Просмотр статистики в графической форме"

Позволяет просмотреть результаты анализа в графической форме: в виде линейной диаграммы (Рис.5.), гистограммы (Рис.6.) и круговой диаграммы (Рис.7.). Каждая диаграмма имеет свой пункт меню настройки, аналогичный показанному выше на рисунке (4 пункт "d") и общий пункт настройки (пункт "с"). Меню общей настройки позволяет задать число отсчетов для формирования графического отображения и то, как отображать эти отсчеты. А именно: выбранное число отсчетов соотнести ко всем знакам (словам) или только к выбранным (пункт "Статистика N-1 отсчетов к остальным значениям \ Статистика выбранных N отсчетов"). Если поставить галочку в меню "Настройка\Работа", то можно настроить графическое отображение до его использования для анализа текстов.

lfm05.jpg

Рис.5. Линейная диаграмма результатов

lfm06.jpg

Рис.6. Гистограмма анализа результатов

lfm07.jpg

Рис.7. Круговая диаграмма результатов

В начало

В начало

Скачать демоверсию

Программа высылается в обновлении декабря 2014г. с добавкой работы со статистикой по группам слов и адаптацией к другим, кроме русского, языкам

Особенности работы с программой

Программа требует для работы Windows XP SP3 и выше (то есть - у вас должен быть установлен Frameworks 4).
Для тех, у кого старый Windows, потребуется установить дистрибутивный пакет Microsoft .NET Framework 4.0 или выше. Его можно скачать бесплатно с сайта Microsoft (Ссылка 1) или более близких ссылок. В любом поисковике наберите "Microsoft .NET Framework 4 скачать" и Вы найдете еще множество ссылок и инструкций по установке (хотя они и не требуются, пакет устанавливается как обычная программа).

Программа поставляется как zip архив. Распакуйте "setupLFMG32.zip" или "setupLFMG64.zip" в любое место жесткого диска. Запустите setupLFM.exe, отвечайте на вопросы и программа будет установлена. Не ставьте лишних галочек при инсталляции, за исключением "Поместить иконку на рабочем столе" - ее поставьте обязательно.

После установки программы вы найдете в меню "Пуск", "Все программы", "wladm" папку с программой и иконку программы на рабочем столе.

lfm08.gif

Пароль в настройках 12345

Здесь можно Скачать демоверсию программы для XP, Windows 7,8 (32бит) ~ 3200 кб.

Здесь можно Скачать демоверсию программы для Windows 7,8 (64бит) ~ 3200 кб.

Данная программа - демоверсия! Демоверсия имеет ограничения: В статистике отображается только каждая четвёртая строка. Если Вас заинтересовала программа - пишите автору wladm@narod.ru , кружечка хорошего пива автору и Вы сможете работать с полной версией программы.

Молчанов Владислав 1.12.2008г. - 25.12.2014г.

В начало страницы

На главную страницу


Размещено 11.01.2015г. http://softobzor.ru/


Размещено 25.12.2014г. на http://hhm.ru HHM.ru - Информер программы - Литературный