Текстометр. Анализ сложности текста на русском языке
Анализ сложности текста
Текстометр позволяет оценить уровень сложности текста, провести частотный анализ слов, найти ключевые слова и самые полезные для изучения слова, коэффициент лексического разнообразия текста, а также статистику по вхождению слов в лексические минимумы для изучающих русский язык как иностранный.
Русский как иностранный
Русский как родной
Измерить
Вставить демо текст
Текстометр позволяет быстро получить информацию о тексте, актуальную для его подготовки к уроку русского языка: уровень сложности текста, ключевые слова, самые полезные слова, статистика по вхождению слов в лексические минимумы. Подробнее о том, как использовать эти данные при подготовке текста можно прочитать здесь [1].
Определение уровня текста для иностранных учащихся
Определение уровня по шкале CEFR от А1 до С2 происходит автоматически, с помощью регрессионной модели, обученной на корпусе из 700 текстов из пособий по РКИ. Подробнее о параметрах модели и признаках, на которых она обучалась, можно почитать здесь [2].
Может ли она ошибаться? Эксперименты показывают, что модель склонна немного завышать уровень сложности текста, поскольку она производит расчеты исходя из данных лексических минимумов. Практика же показывает, что студенты обычно знают (или угадывают из контекста) больше слов, чем в минимумах. Особенно это касается интернационализмов и слов, которые похоже звучат на родном языке ученика. Это стоит учитывать при подготовке текстов для славяно- или англоговорящих учеников. Подробнее об эксперименте со сравнением работы программы, мнения экспертов-преподавателей и самих студентов можно почитать здесь [3].
Определение уровня текста для носителей языка
Уровни сложности текста для иностранцев хорошо стандартизированы и задокументированы. В текстах для носителей языка понятие сложности текста многограннее: текст бывает написан короткими словами и фразами, что позволяет стандартным формулам читабельности отнести его к простым, но “продраться” сквозь незнакомые слова или стилистические особенности затруднительно.
Поэтому тексты для чтения носителем языка наша система оценивает по двум критериям: структурная сложность и лексическая. Структурная сложность учитывает классическую формулу читабельности Флеша, адаптированную для русского языка, а также наличие частей речи и оборотов, затрудняющих чтение (причастия, пассивные формы и др.) Лексическая сложность рассчитывается на основании вхождения слов текста в специализированные частотные списки.
Виктория Максимова
преподаватель РКИ, основатель FB сообщества «Сторителлинг в РКИ»
Теперь, когда Текстометр появился, мне уже трудно представить, как бы я готовила тексты без него. Это незаменимый инструмент для моей работы: строгие объективные параметры оценки, простой и интуитивно понятный дизайн. Спасибо разработчикам проекта!
Анна Голубева
главный редактор издательства «Златоуст»
Сервис очень помогает в работе и при общении с авторами! Особенно полезен частотный список, объективирует, что целесообразно оставлять в тексте, а что адаптировать или тренировать. Спасибо коллегам из Института Пушкина!
Юлия Некрасова
преподаватель РКИ Университета Салерно
Очень ценная методическая находка! Огромный потенциал для подготовки заданий для уровней B1 — C1, диктантов, заданий для экзаменов и т.п. Прошу прощения за сленг, но огромный респект разработчикам!
При ссылке на ресурс мы рекомендуем цитировать данную работу:
[1] Лапошина А. Н., Лебедева М. Ю. Текстометр: онлайн-инструмент определения уровня сложности текста по русскому языку как иностранному // Русистика. 2021. Т. 19. №3. C. 331-345
Ещё публикации о программе:
[2] Laposhina А. N., Veselovskaya Т. S., Lebedeva M. U., Kupreshchenko O. F. Automated Text Readability Assessment For Russian Second Language Learners // Komp’juternaja Lingvistika i Intellektual’nye Tehnologii Сер. «Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference «Dialogue 2018». Issue 17 (24), 2018
[3] Лапошина А. Н. Опыт экспериментального исследования сложности текстов по РКИ // Динамика языковых и культурных процессов в современной России [Электронный ресурс]. — Вып. 6. Материалы VI Конгресса РОПРЯЛ (г. Уфа, 11–14 октября 2018 года). — СПб.: РОПРЯЛ, 2018. С. 1154-1179
Куратор проекта — Антонина Лапошина
Если у вас возник вопрос, вы нашли ошибку или считаете, что не хватает какой-то функции, обязательно напишите мне с пометкой «Текстометр». Мы очень любим и ценим обратную связь!
[email protected]
antonina.laposhina
Частотный анализ текста. Пример написания калькулятора
В общем, есть такая тема — частотный анализ текста. Утверждается, что для данного языка частота встречаемости отдельных букв в осмысленном тексте есть устойчивая величина. Устойчивыми также являются комбинации двух, трех (биграммы, триграммы) и четырех букв.
Этот факт, в частности, использовался в криптографии для вскрытия шифров.
Я в криптографии не очень, и единственное, что приходит на ум, это вскрытие шифра прямой замены. Надо сказать, наиболее примитивного шифра, когда символы исходного алфавита, используемого в сообщении, преобразуются в другие символы по определенному правилу. Такие шифры, кстати сказать, можно было вскрывать и без применения статистического анализа (где для уменьшения погрешности, очевидно, требуется наличие довольно больших кусков текста), а просто догадываясь о некоторых словах — см. рассказ «Пляшущие человечки».
Вот тут, впрочем, интересная статья про историю криптографии.
На самом деле частота встречаемости букв также зависит от типа текста. Калькулятор ниже рассчитывает частоты букв для введенного пользователем текста и выводит для сравнения теоретические частоты букв для художественного русского текста. В качестве значения по умолчанию взят научный текст (начало определения дифференциального уравнения из Википедии), и сразу видно, как, например, различается частота встречаемости буквы Ф в художественном и научном текстах.
Частоты букв для художественного текста я взял отсюда, ну а по указанному адресу утверждают, что взяли их из книги «Яглом А. М., Яглом И. М., Вероятость и информация, М.: Наука, 1973».
Этот калькулятор был создан как пример, для того чтобы продолжить рассказ о том, как создавать калькуляторы на этом сайте, начатый здесь — Площадь четырехугольника. Пример написания калькулятора. В данном случае на примере этого калькулятора я расскажу о том, как писать калькуляторы, выводящие таблицы и строящие графики. Как обычно, все что нужно от автора — некоторое знание Javascript, ну или вообще любого алгоритмического языка программирования. Интересующиеся смотрят текст после самого калькулятора.
Частотный анализ текста
Дифференциальное уравнение — уравнение, связывающее значение некоторой неизвестной функции в некоторой точке и значение её производных различных порядков в той же точке. Дифференциальное уравнение содержит в своей записи неизвестную функцию.
Точность вычисления
Знаков после запятой: 2
Частотный анализ
Файл очень большой, при загрузке и создании может наблюдаться торможение браузера.
Как я уже писал, этот сайт — движок по созданию онлайн-калькуляторов на Javascript. Продолжим срывать покровы таинственности с этого процесса.
Создавать калькуляторы могут зарегистрированные пользователи. После регистрации надо зайти в раздел «Мои калькуляторы» и выбрать пункт меню «Создать…» -> «Калькулятор».
Откроется форма, которая заполняется примерно так:
Далее нужно добавить поле ввода — для получения анализируемого текста от пользователя. Делаем это, нажимая на кнопку in, помеченную красной рамкой на рисунке выше. Открывшийся диалог заполняем следующим образом:
Следующий шаг — создать выходную таблицу, колонки которой должны содержать соответственно букву, частоту ее встречаемости в тексте, выраженную в процентах, и теоретическую частоту ее встречаемости в художественном русском тексте, тоже выраженную в процентах. Итого три колонки. Сразу замечу, что данные таблицы в нашем движке является исходными данными для графика, поэтому, описывая таблицу, мы одновременно будем описывать и график.
Для добавления таблицы нажимаем на кнопочку tbl, отмеченную красной рамкой
Открывается диалог формирования таблицы. Верхняя часть диалога используется для общих свойств, нижняя — для создания колонок. Заполняем форму как указано и нажимаем кнопку «Добавить» для создания первой колонки.
Обратите внимание на то, что в поле «Отображение столбца» выбрано значение «Отображать на графике». Первая колонка с таким значением автоматически становится осью Х графика (ну так сделано). В данном случае по оси Х мы будем откладывать буквы, а по оси Y — частоты.
Добавляем второй столбец (первая серия по оси Y)
Добавляем третий столбец (вторая серия по оси Y)
Таблица и график готовы — закрываем диалог, нажав на «ОК».
Входные и выходные параметры готовы, можно приступать к написанию кода функции Calculate, производящей непосредственные вычисления.
Для начала зададим справочные теоретические значения частот букв в художественном русском тексте. Для того, чтобы не усложнять пример, опишем их простым массивом:
Далее напишем цикл, считающий вхождения букв и помещающий эти данные в массив freqarr, а также считающий общее число букв в тексте и помещающий его в переменную total. Обратите внимание на то, что все не-буквы пропускаются и не участвуют в подсчете, а также на то, что буквы Е и Ё, а также Ь и Ъ объединены. Переменная text это то название, которое мы задали для входного параметра в поле «Переменная» (см. вторую картинку).
Далее мы отсортируем полученные результаты:
И наконец перейдем к созданию таблицы.
В функции Calculate таблица представлена параметром freqreport (так, как мы написали в поле «Переменная» в диалоге создания таблицы). Это объект с единственным методом AddNewRecord. Метод AddNewRecord также возвращает объект, который представляет собой индивидуальную строчку в таблице. У данного объекта есть свойства, которые доступны через имена переменных, заданных нами для столбцов таблицы, а именно letter, freq и theory. Собственно, вся задача теперь сводится к созданию строк и заполнению этих свойств у каждой строки, что и сделано ниже.
Итого, полный код функции:
После написания функции Calculate надо нажать на кнопку «Просмотр» и посмотреть, что получилось. Вообще эта кнопка — аналог кнопки «Сохранить», поэтому жать ее надо периодически, даже если калькулятор не дописан — вдруг разорвется соединение, тогда все пропадет. Я предупредил.
Если в Javascript нет синтаксических ошибок, то после нажатия кнопки «Просмотр» откроется форма просмотра калькулятора, где можно попробовать, как он работает.
Остается последний шаг — опубликовать калькулятор. После его публикации он получит постоянную ссылку на сайте, ну и, собственно, посетители сайта смогут им пользоваться. Для этого нажимаем на кнопку «Опубликовать», и после публикации внизу страницы появится сообщение вида
Текущая версия была опубликована. Результат доступен по адресу www.planetcalc.ru/732
И последний штрих (необязательный). Иногда (пока практически всегда) калькулятор требуется снабдить описанием — что за параметры, по каким формулам считает, и вообще, зачем это все — прямо как я сейчас делаю. Для этого пишется статья, и калькулятор вставляется прямо в статью. Чтобы написать статью, выбираем на главной странице раздела «Мои калькуляторы» пункт меню «Создать…» -> «Статью» и начинаем писать. Чтобы вставить калькулятор, нажимаем кнопку с большой подчеркнутой буквой А, и выбираем в открывшемся диалоге только что созданный калькулятор.
анализ Как написать калькулятор Криптография лингвистика пример Статистика текст частота частотный анализ текста
Счетчик частоты слов — Подсчет вхождений слов — Онлайн
Самый простой в мире онлайн-калькулятор частоты слов для веб-разработчиков и программистов. Просто вставьте свой текст в форму ниже, нажмите кнопку «Рассчитать частоту слов», и вы получите статистику по отдельным словам. Нажмите кнопку – получите количество слов. Никакой рекламы, ерунды и мусора.
Объявление : Мы только что запустили DEVURLS — отличный агрегатор новостей для разработчиков. Проверьте это!
(отменить)
Хотите найти количество слов в тексте?
Используйте счетчик слов!
Счетчик частоты слов может быть полезен, если вы проводите кросс-браузерное тестирование. Например, если вы создали веб-приложение, которое принимает комментарии пользователей, вы можете запретить пользователям повторять одни и те же слова в комментариях слишком много раз. Вы можете использовать эту утилиту для написания тестовых примеров для отлова комментариев с большим количеством повторяющихся слов. Также эта программа может быть полезна, если вы занимаетесь статистическим анализом текста или оптимизируете текст для SEO. Кроме того, вы можете использовать эту программу, чтобы узнать, на каком языке написан данный текст. В каждом языке есть слова, которые встречаются чаще, чем другие, и такое распределение слов уникально для каждого языка.
Ищете дополнительные инструменты веб-разработчика? Попробуйте это!
URL Encoder
URL Decoder
URL Parser
HTML Encoder
HTML Decoder
Base64 Encoder
Base64 Decoder
HTML Prettifier
HTML Minifier
JSON Prettifier
JSON Minifier
JSON Escaper
JSON Unescaper
JSON Validator
JS Prettifier
JS Minifier
JS Validator
CSS Prettify
Minifier CSS
XML Prettifier
XML Minifier
XML в JSON Converter
JSON TO CONTRETE Преобразователь XML
Преобразователь YAML в TSV
Преобразователь TSV в YAML
Преобразователь XML в TSV
Преобразователь TSV в XML
Преобразователь XML в текст
Преобразователь JSON в CSV
CSV в JSON Converter
JSON TO YAML Converter
YAML TO JSON Converter
JSON TO TSV Converter
TSV TO JSON Converter
YSON TOT TEXT CONTRETE Конвертер TSV в CSV
Конвертер CSV в TSV
Конвертер CSV в текстовые столбцы
Конвертер текстовых столбцов в CSV
Конвертер TSV в текстовые столбцы
Конвертер текстовых столбцов в TSV
CSV Transposer
Столбки CSV для строк преобразователя
CSV строки в столбцы преобразователь
CSV Clecper Swapper
CSV Column Defore
CSV Column Column
CSV Prepender
CSV COBLACER
CSV CSV
CSV CSV COBLACER
CSV
CSV CSV. Средство удаления столбцов CSV
Средство смены разделителя CSV
Транспозитор TSV
Преобразователь столбцов в строки TSV
Преобразователь строк в столбцы TSV
Преобразователь столбцов TSV
TSV Column Exporter
TSV Column Replacer
TSV Column Prepender
TSV Column Appender
TSV Column Inserter
TSV Column Deleter
TSV Delimiter Changer
Delimited Column Exporter
Delimited Column Deleter
Delimited Column Replacer
Преобразователь текста
Преобразователь текстовых столбцов в строки
Преобразователь текстовых строк в столбцы
Преобразователь текстовых столбцов
Text Column Delimiter Changer
HTML to Markdown Converter
Markdown to HTML Converter
HTML to Jade Converter
Jade to HTML Converter
BBCode to HTML Converter
BBCode to Jade Converter
BBCode to Text Converter
HTML Преобразователь времени в текст
HTML Stripper
Преобразователь сущностей текста в HTML
Преобразователь времени UNIX в время UTC
Преобразователь времени UTC в время UNIX
IP в двоичный преобразователь
Двоирный в IP -преобразователь
IP в десятичный преобразователь
Октальный в IP -преобразователь
IP в восьмовый преобразователь
Десятичный в IP -преобразователь
IP в Hex Converter
HEX в IP -конвертер
IP — Сортировщик адресов
Генератор паролей MySQL
Генератор паролей MariaDB
Генератор паролей Postgres
Генератор паролей Bcrypt
Средство проверки паролей Bcrypt
Scrypt Password Generator
Scrypt Password Checker
ROT13 Encoder/Decoder
ROT47 Encoder/Decoder
Punycode Encoder
Punycode Decoder
Base32 Encoder
Base32 Decoder
Base58 Encoder
Base58 Decoder
Ascii85 Encoder
Декодер Ascii85
Кодировщик UTF8
Декодер UTF8
Кодировщик UTF16
Декодер UTF16
Кодировщик Uuencoder
Uudecoder
Morse Code Encoder
Morse Code Decoder
XOR Encryptor
XOR Decryptor
AES Encryptor
AES Decryptor
RC4 Encryptor
RC4 Decryptor
DES Encryptor
DES Decryptor
Triple DES Encryptor
Triple DES Decryptor
Rabbit Encryptor
Rabbit Decryptor
NTLM Hash Calculator
MD2 Hash Calculator
MD4 Hash Calculator
MD5 Hash Calculator
MD6 Hash Calculator
RipeMD128 Hash Calculator
RipeMD160 Hash Calculator
RipeMD256 Hash Calculator
RipeMD320 Hash Calculator
SHA1 Hash Calculator
SHA2 Hash Calculator
SHA224 Hash Calculator
Калькулятор хэша SHA256
Калькулятор хэша SHA384
Калькулятор хэша SHA512
Калькулятор хэша SHA3
CRC16 Хэш -калькулятор
CRC32 Хэш -калькулятор
Adler32 Hash Calculator
Whirlpool Hash Calculator
Все хеш -калькулятор
секунды H: M: S Converter
H: M: S Converter
Seconds Secondable к человеку. Время
Преобразователь двоичного кода в восьмеричный
Преобразователь двоичного кода в десятичный
Преобразователь двоичного кода в шестнадцатеричный
Преобразователь восьмеричного в двоичный
Преобразователь восьмеричного в десятичный
октября в шестнадцатеричном преобразователе
Десятичный в двоичный преобразователь
Десятичный в восьмовый преобразователь
Десятичный в шестнадцатеричный преобразователь
HEX в бинарный преобразователь
HEX в октальный преобразователь
HEX в Decimal Converter
Decimal To BCD Converter
Decimal To BCD.Преобразователь восьмеричных чисел в двоично-десятичные
Преобразование двоично-десятичных чисел в восьмеричные
Преобразование шестнадцатеричных чисел в двоично-десятичные
Преобразование двоично-десятичных чисел в шестнадцатеричные
Преобразование двоичных чисел в серые
от серого до бинарного преобразователя
октальный в серой преобразователь
от серого в октальный преобразователь
Десятичный в серой конвертер
от серого в десятичный преобразователь
Гексадецимальный в серого преобразователя
серо Калькулятор продукта
Калькулятор двоичного побитового И
Калькулятор двоичного побитового И-НЕ
Калькулятор двоичного побитового ИЛИ
Калькулятор двоичного побитового НЕ-ИЛИ
Бинарный бить калькулятор XOR
Бинарный бить калькулятор XNOR
Бинарный бить. Не калькулятор
Бинарный битовый инвертор
Binar Bit Reverser
Бинарный ротатор
Бинальный ротатор.
Преобразователь числовой базы
Преобразователь римских чисел в десятичные
Преобразователь десятичных чисел в римские
Преобразователь чисел в слова
Преобразователь слов в числа
Круглые числа выше
Круглые номера вниз
UTF8 в шестнадцатеричный преобразователь
HEX в UTF8 преобразователь
Текст в коды ASCII
ASCII в текстовый преобразователь
Текст в бинарный преобразователь
Бинарный в текстовый преобразователь
Текст.
Преобразователь восьмеричного в текст
Преобразователь текста в десятичный
Преобразователь десятичного в текст
Преобразователь текста в шестнадцатеричный
Преобразователь шестнадцатеричного в текст
Текст в нижний конвертер
Текст в верхний конвертер
Текст в случайное преобразователь
Текст в Tittlecase Converter
Заглаживание слов в тексте
Текстовый чехол. Конвертер
Преобразователь табуляции в пробелы
Преобразователь пробелов в символы новой строки
Преобразователь новой строки в пробелы
Преобразователь диакритических знаков
Extra Whitespaces Remover
All Whitespaces Remover
Punctuation Mark Remover
Thousands Separator Adder
Backslash Remover
Backslash Adder
Text Transformer
Text Repeater
Text Replacer
Text Reverser
Text Rotate
Text Вращатель символов влево
Вращатель текстовых символов вправо
Калькулятор длины текста
Сортировщик текста по алфавиту
Числовой текст сортировщика
Текст по длине сортировщик
Текст из генератора REGEX
Центральный текст
Правопрокат Текст
Текст левого столбца
Текст правой падки
Обоснованный текст
Текст. Regex Match Extractor
Regex Match Replacer
Email Extractor
URL Extractor
Number Extractor
List Merger
List Zipper
List Intersection
Разница в списках
Printf Formatter
Текст GREP
Текстовая головка
Текст хвост
Экстрактор линии
Сортер Word
Word Wrapper
Сплиттер Word
Добавить номера линии
Добавить линию
Добавить линейные номера
Добавить линию
Добавить линейные номера
Добавить линию
Добавить линейные номера
Добавить линию
. Суффиксы строк
Добавление префикса и суффикса
Поиск самой длинной текстовой строки
Поиск самой короткой текстовой строки
Удаление повторяющихся строк
Удаление пустых строк
Текстовая линия Rampodizer
Letter Ramdigizer
Text Line Joiner
Строковой разветвитель
Text Line Reverser
ФИЛЬТР ТЕКСТРАЦИЯ ЛИНИЯ
Номер буквы в текстовом счетчике
Номер слова в текстовом счетчике
Номер строк в строках в Счетчик текста
Счетчик количества абзацев в тексте
Калькулятор частоты букв
Калькулятор частоты слов
Калькулятор частоты фраз
Text Statistics
Random Element Picker
Random JSON Generator
Random XML Generator
Random YAML Generator
Random CSV Generator
Random TSV Generator
Random Password Generator
Random String Generator
Random Number Generator
Генератор случайных дробей
Генератор случайных бинов
Генератор случайных чисел
Генератор случайных чисел
Генератор случайных шестнадцатеричных чисел
Random Byte Generator
Random IP Generator
Random MAC Generator
Random UUID Generator
Random GUID Generator
Random Date Generator
Random Time Generator
Prime Number Generator
Fibonacci Number Generator
Pi Digit Generator
E Генератор цифр
Преобразователь десятичных чисел в научные
Преобразователь научных чисел в десятичные
Преобразователь JPG в PNG
PNG в JPG Converter
GIF TO PNG Converter
GIF для JPG Converter
BMP в PNG Converter
BMP в JPG Converter
Image To Base64
Файл в Base64 Converter
JSON JSSON JANSON DOVERTER
. Преобразователь XML в Base64
Преобразователь Hex в RGB
Преобразователь RGB в Hex
Преобразователь CMYK в RGB
Преобразователь RGB в CMYK
Преобразователь CMYK в Hex
HEX в CMYK Converter
IDN Encoder
IDN Декодер
миль до километра преобразователя
километров в миль
Celsius Converter.
Конвертер фунтов в килограммы
Конвертер килограммов в фунты
Мой IP-адрес
Все инструменты
Совет: вы можете использовать аргумент запроса ?input=text для передачи текста в инструменты.
Счетчик слов и символов
Иногда бывает очень удобно иметь инструмент счетчика слов, который может дать любому представление или обзор содержания, которое он написал, и сколько слов или даже символов оно уже содержит. Такие потребности могут возникнуть, когда человек работает в научной сфере, который должен писать исследовательские работы, статьи, журналы или задания, будучи студентом. Обычно автор ограничен количеством слов правилами целевого экземпляра или рекомендациями по приему какого-либо журнала или интернет-блога.
Итак, что делать, если вы столкнулись с требованиями по ограничению объема текста внутри вашей статьи и должны следовать строгим правилам, подсказанным вашим заказчиком? Как вы можете получить информацию о том, сколько абзацев или слов вы уже набрали и каково общее количество символов в уже подготовленной статье в веб-блоге конкурента?
Наш счетчик символов и слов поможет вам в этом!
Не будем игнорировать, ежедневные статьи появляются в интернете каждую минуту, большинство из них ограничено количеством символов, люди ограничены ограничениями символов и должны рассчитывать слова при написании судебных разбирательств, рекламных колонок и статей в СМИ. Каждый день писатели и блоггеры борются за своих посетителей, следуя некоторым непредсказуемым правилам SEO. Без сомнения, инструменты, подобные нашему, ежедневно востребованы на рынке.
Теперь, когда Microsoft Word раздается в Интернете со своим Office 365, наш инструмент поможет вам проанализировать документ и обобщить подробную статистику содержания онлайн и бесплатно. Эта статистика, предоставленная нашим сервисом, дает представление о качестве текста, частоте слов, которые вы написали в отрывке, а также о сочетании символов и знаков препинания. Кроме того, наша служба подсчета слов и символов не только ограничивается подсчетом количества букв или слов, которые вы только что набрали, но также анализирует количество предложений, строк, цифр, количество знаков препинания (цифр или определенных знаков) и событие дает вам общее представление о том, сколько времени вам нужно, чтобы прочитать все написанное.
В нашем анализаторе предусмотрена возможность просмотра вхождений фраз, символов и плотности подсчета слов. Статистика показывает результаты в процентах от покрытия текста и дает пользователю возможность контролировать минимальное и максимальное количество букв и количество слов, отображаемых в инструменте.
Что удобно, так это то, что онлайн-инструмент для подсчета слов удобен для пользователя и может выполнять свою работу по подсчету статистики независимо от языка и источника текста. В дополнение к этому, инструмент также дает нашим пользователям больше контроля над плагиатом и SEO-текстом, используя фильтр так называемых «стоп-слов».
Давайте посмотрим на пример ниже:
" Я теперь понимаю, это был не совсем ваш злой нрав брата заставил его искать свою смерть; но вызывающая заслуга, приведенная в действие предосудительным зло в себе. " (В. Шекспир, «Король Лир»)
Как копирайтер, я ожидал бы от любого инструмента, который подсчитывает информацию о словах и символах, — 28 слов в общем (при 161 символе в резюме), но в то же время, будучи более ориентированным на SEO, меня больше интересовал бы вес. всего текста, исключая стоп-слова, которые приведут меня к 13 словам в резюме (выделенные слова взяты из английского списка стоп-слов).
Сервис счетчика слов позволяет исключить часто используемые стоп-слова из анализа нашей поисковой системой, чтобы сделать статистику и отчеты более точными и конкретными.
Кроме того, наш счетчик может легко анализировать содержимое любого из широко используемых форматов, таких как PDF, Word, HTML (с возможностью избавиться от всех html и мета-тегов) или даже книги ePUB. Для этого вы должны загрузить свой документ вручную, после чего его содержимое будет автоматически преобразовано в обычный текст с помощью нашего сервисного движка и появится в основной области редактирования.
Сервис достаточно гибок независимо от типа источника. Наконец, наш счетчик также позволяет пользователю печатать, следя за количеством символов и слов в процессе набора и вычисляя всю статистику на лету. Редакторы или ответственные лица могут настроить текст в нужном формате и форме, сделать аналитический отчет и, наконец, сохранить набранный контент в заданном формате.