Разное

Оценка текста: Работа копирайтером на дому, биржа копирайтинга TEXT.RU

25.06.2023

Текстометр — анализ сложности текста онлайн

Текстометр помогает бесплатно определить уровень сложности и читабельности текста, посчитать количество слов и знаков, найти среднюю длину слова и предложения, ключевые слова текста, рассчитать коэффициент лексического разнообразия текста, получить список слов текста и рассчитать время его чтения.

Русский как иностранный

Русский как родной

Определить

Вставить демо текст

О проекте

Текстометр помогает бесплатно определить уровень сложности текста на русском языке, рассчитать индексы удобочитаемости, узнать уровень текста по шкале CEFR, рассчитать посчитать количество слов и знаков, найти ключевые слова текста, рассчитать коэффициент лексического разнообразия текста, получить список слов из текста и рассчитать время его чтения, а также определить статистику по вхождению слов в лексические минимумы.

Уровень CEFR и ТРКИ/TORFL

Определение уровня сложности текста по шкале CEFR от А1 до С2 происходит автоматически, с помощью регрессионной модели, обученной на корпусе из 800 текстов из пособий по РКИ. В разделе Публикации вы можете найти статьи с более подробной информацией о том, как работает автоматическое определение сложности текста в нашем сервисе [2], о корпусе текстов из пособий РКИ RuFoLa [3] и о том, как использовать Текстометр на уроке русского языка [1].

Уровень ACTFL

Уровень сложности текста по шкале ACTFL предлагается с помощью таблицы соответствий CEFR и ACTFL в разделе рецептивных навыков. Подробнее о соответствиях здесь.

Может ли она ошибаться? Эксперименты показывают, что модель склонна немного завышать уровень сложности текста, поскольку она производит расчеты исходя из данных лексических минимумов. Практика же показывает, что студенты обычно знают (или угадывают из контекста) больше слов, чем в минимумах. Особенно это касается интернационализмов и слов, которые похоже звучат на родном языке ученика. Это стоит учитывать при подготовке текстов для славяно- или англоговорящих учеников. Подробнее об эксперименте со сравнением работы программы, мнения экспертов-преподавателей и самих студентов можно почитать здесь [4].

Оценка уровня сложности текста для школьников

Уровни сложности текста для иностранцев хорошо стандартизированы и задокументированы. В текстах для носителей языка понятие сложности текста многограннее: текст бывает написан короткими словами и фразами, что позволяет стандартным формулам читабельности отнести его к простым, но «продраться» сквозь незнакомые слова или стилистические особенности затруднительно.

Поэтому проверка текст на читабельность носителями языка наша система оценивает по двум критериям: структурная сложность и лексическая. Структурная сложность учитывает классическую формулу читабельности Флеша, адаптированную для русского языка, а также наличие частей речи и оборотов, затрудняющих чтение (причастия, пассивные формы и др.) Лексическая сложность рассчитывается на основании вхождения слов текста в специализированные частотные списки. Усредненная оценка по этим двум векторам сложности позволяет оценить уровень текста по возрасту и классу. Об этой технологии можно подробнее прочитать здесь [5].

Длина текста в словах, в знаках и предложениях

Объем текста в словах, знаках и предложениях являются базовыми характеристиками текста, особенно полезными для расчета времени, которое потребуется на его освоение, или при подготовке проверочных материалов, где объем текста обычно строго определен государственным стандартом по РКИ. Например, рекомендуемая длина текста для чтения уровня A1 составляет 250–300 слов, А2 – 600–700 слов и т.д.

Средняя длина слова и предложения

Подсчет средней длины слова и предложения служит для определения сложности текста или его отдельных фрагментов. Так, большое количество формул читабельности используют данные показатели в качестве основных (DuBay, 2004).

Коэффициент лексического разнообразия (lexical diversity)

Коэффициент лексического разнообразия рассчитывается как отношение количества уникальных слов текста к количеству всех слов текста и обозначается величиной от близкой к 0 до 1 (когда все слова в тексте уникальны и встретились только по одному разу). Эта мера полезна для оценки повторяемости, воспроизводимости лексики текста и также способна сигнализировать о его трудности. Например, коэффициент лексического разнообразия отрывка аутентичного публицистического текста в среднем составляет 0,8, а учебного текста уровня В1 – 0,5. Однако этот коэффициент стоит с осторожностью использовать на коротких учебных текстах: в одном абзаце, скорее всего, почти все знаменательные слова будут уникальны, тогда как в целом тексте более вероятно повторяются основные имена, локации, понятия и действия.

Поиск ключевых слов текста

Поиск ключевых слов текста вычисляется как отношение количества раз, которое слово встречается в анализируемом тексте к частоте слова по Национальному корпусу русского языка (мера TF/IDF с корректирующим коэффициентом). Наивысший рейтинг получают слова, которые часто встречаются в данном тексте, но редко – во всех других текстах корпуса, то есть максимально характерные именно для этого текста. Например, в тексте интервью с музыкантом слова музыка и рэп встречаются по три раза. Но при этом музыка встречается в Национальном корпусе 45 000 раз, а рэп – 270. С этой точки зрения, слово рэп является более характерным и необходимым для понимания данного текста. При этом появление слова в списке ключевых слов вовсе не означает, что оно должно остаться в тексте при адаптации: слово может быть заменено на синоним или снабжено толкованием. Его присутствие в списке говорит лишь о том, что оно играет важную роль для понимания данного текста и на него стоит обратить особое внимание при переработке текста.

Уровень сложности слов текста по шкале CEFR

Статистика по лексическим минимумам включает в себя информацию о том, сколько процентов текста покрывается лексическими минимумами того или иного уровня, а ниже указывается список слов, не вошедших в официальный лексический минимум стандартов ТРКИ данного уровня. Количество незнакомой лексики является важнейшим показателем языковой доступности текста: многочисленные исследования говорят о самой тесной связи знакомости лексики текста и успешности его понимания (Nation, 2006; Qian, 2002). Государственный стандарт по РКИ также содержит информацию о рекомендуемом количестве незнакомой лексики, который постепенно растет от 2–3% для уровня A1 до 10% для уровня C1.

Частотный анализ текста

Частотный анализ текста позволяет, во-первых, получить полный частотный список слов текста, а во-вторых, статистику по доле в тексте слов из списка 5 000 самых частотных слов русского языка. Для расчета статистики по частотности слов мы использовали Новый частотный словарь современного русского языка.

Расчетное время чтения текста

Расчет времени чтения текста опирается на информацию из государственного стандарта по РКИ и предлагает ориентировочное время чтения текста иностранным студентом в зависимости от задачи чтения – изучающего или просмотрового. Такая информация появляется в стандартах по РКИ начиная с уровня В1 и составляет для этого уровня 50 слов в минуту для изучающего чтения и 100 слов в минуту для просмотрового. Для уровней ниже В1 мы взяли на себя смелость продолжить эту шкалу расчетной скорости чтения исходя из педагогического опыта.

Виктория Максимова

преподаватель РКИ, основатель FB сообщества «Сторителлинг в РКИ»

Теперь, когда Текстометр появился, мне уже трудно представить, как бы я готовила тексты без него. Это незаменимый инструмент для моей работы: строгие объективные параметры оценки, простой и интуитивно понятный дизайн. Спасибо разработчикам проекта!

Анна Голубева

главный редактор издательства «Златоуст»

Сервис очень помогает в работе и при общении с авторами! Особенно полезен частотный список, объективирует, что целесообразно оставлять в тексте, а что адаптировать или тренировать. Спасибо коллегам из Института Пушкина!

Юлия Некрасова

преподаватель РКИ Университета Салерно

Очень ценная методическая находка! Огромный потенциал для подготовки заданий для уровней B1 — C1, диктантов, заданий для экзаменов и т.п. Прошу прощения за сленг, но огромный респект разработчикам!

Публикации

При ссылке на ресурс мы просим цитировать данную работу:

[1] Лапошина А. Н., Лебедева М. Ю. Текстометр: онлайн-инструмент определения уровня сложности текста по русскому языку как иностранному // Русистика. 2021. Т. 19. №3. C. 331-345

Ещё публикации о программе:

[2] Laposhina А. N., Veselovskaya Т. S., Lebedeva M. U., Kupreshchenko O. F. Automated Text Readability Assessment For Russian Second Language Learners // Komp’juternaja Lingvistika i Intellektual’nye Tehnologii Сер. «Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference «Dialogue 2018». Issue 17 (24), 2018

[3] Лапошина А.Н. Корпус учебников РКИ как инструмент анализа учебных материалов // Русский язык за рубежом. 2020. № 6 (283). С. 22-28

[4] Лапошина А. Н. Опыт экспериментального исследования сложности текстов по РКИ // Динамика языковых и культурных процессов в современной России [Электронный ресурс]. — Вып. 6. Материалы VI Конгресса РОПРЯЛ (г. Уфа, 11–14 октября 2018 года). — СПб.: РОПРЯЛ, 2018. С. 1154-1179

[5] Лапошина А. Н., Лебедева М.Ю., Берлин Хенис А.А. Влияние частотности слов текста на его сложность: экспериментальное исследование читателей младшего школьного возраста методом айтрекинга // Russian Journal of Linguistics. — 2022. — Т. 26. — №2. — C. 493-514.

Проверка на читабельность текстов — PlainRussian.ru

Проверка на читабельность текстов — PlainRussian.ru
  • Текст
  • Веб-страница

Удобный инструмент проверки текстов

Инструмент оценки читабельности текстов позволяет определить удобство чтения и простоту восприятия материалов. Он подходит для сайтов, брошюр, руководств, инструкций и других текстов. Позволяет при необходимости своевременно внести необходимые исправления в текст.

Для кого этот сервис

Сервис подходит всем, кто создаёт тексты различных жанров и хочет, чтобы они были доступными и легко воспринимались аудиторией. Сервис может быть полезен копирайтерам, журналистам, контент-менеджерам, разработчикам — всем, кто создаёт веб-проекты.

Как это работает

Для оценки читабельности текстов используется 5 формул, адаптированных для русского языка:

  • Формула Flesch-Kincaid
  • Индекс Колман-Лиау
  • Automatic Readability Index
  • SMOG (Simple Measure of Gobbledygook)
  • Формула Дэйла-Чейла

В результатах отображаются оценки по каждой из формул, а также совокупная оценка сложности текста.

Кроме того, можно узнать значения расчётных показателей: число знаков, букв, слов, предложений, процент использования сложных слов и проч. Эти показатели помогут оценить уровень сложности восприятия.

Почему важно писать простым языком

Простой язык (plain language) — это концепция, в  основе которой лежит идея эффективной и уместной коммуникации с аудиторией, наиболее доступное представление ваших идей читателю. Простой язык предполагает чёткое, прямое, лаконичное выражение мыслей. Это язык, который избегает неясности, многословности и сложных конструкций в тех ситуациях, где это необходимо.

Эта концепция возникла, прежде всего, из-за стремления к открытости и доступности государства. В некоторых странах госучреждения законодательно обязаны использовать простой язык для упрощения доступа к государственным услугам.

Применение простого языка в бизнесе облегчает взаимодействие с клиентами: они легко понимают ваши документы, реже звонят для получения консультаций, делают меньше ошибок при заполнении различных форм, с большей вероятностью придерживаются инструкций, которые вы для них создаёте.

Следование принципам простого языка не означает чрезмерного упрощения текста, а лишь помогает представить информацию в форме, наиболее понятной для широкой аудитории.

API

Для тех, кто хочет автоматизировано проверять тексты, доступно API.

Поддержите проект

Ваша помощь очень важна для нас!
Каждый, даже небольшой, взнос
пойдёт на развитие проекта.

  • Единовременно
  • Ежемесячно

Некоторые общие критерии оценки текстов

Поиск

  • Войти
  • Поиск

Следующий список критериев и основных вопросов может быть полезен для чтения текста и подготовки критического обзора. Не забудьте проверить свои инструкции по заданию для более конкретных критериев и сфокусировать вопросы, которые должны лечь в основу вашего обзора. Продолжительность обзора/задания будет определять, сколько критериев вы будете учитывать в своей критике.

Критерии Возможные основные вопросы
Значение и вклад в область
  • Какова цель автора?
  • В какой степени эта цель была достигнута?
  • Что этот текст добавляет к совокупности знаний? Это может быть с точки зрения теории, данных и/или практического применения
  • Какое отношение он имеет к другим работам в этой области?
  • Что отсутствует/не указано?
  • Это проблема?
Методология или подход (обычно это относится к более формальным, исследовательским текстам)
  • Какой подход был использован для исследования? Например, количественный или качественный, анализ/обзор теории или текущей практики, сравнительный анализ, тематическое исследование, личное размышление и т.
    д.
  • Насколько объективен/пристрастен подход?
  • Являются ли результаты действительными и надежными?
  • Какие аналитические рамки используются для обсуждения результатов?
Аргументация и использование доказательств
  • Есть четкая проблема, утверждение или гипотеза?
  • Какие претензии предъявляются?
  • Является ли аргумент последовательным?
  • На какие доказательства опирается текст?
  • Насколько действительны и надежны доказательства?
  • Насколько эффективны доказательства в поддержку аргумента?
  • Какие выводы сделаны?
  • Обоснованы ли эти выводы?
Стиль письма и структура текста
  • Подходит ли стиль письма для целевой аудитории? Например, эксперт/не эксперт, академик/неакадемик и т. д.
  • Каков организующий принцип текста? Может ли это быть лучше организовано?
  См.
далее: Образец экстракта Вернуться к началу

UNSW Сидней NSW 2052 Австралия | Заместитель вице-канцлера по вопросам образования и опыта студентов

UNSW CRICOS Код провайдера: 00098G | Идентификатор провайдера TEQSA: PRV12055 (Австралийский университет) | АБН: 57 195 873 179

Последнее обновление страницы: пятница, 18 марта 2022 г.

Наверх

Оценка текста — общая оценка ресурсов

Оценка авторов и издателей

Посмотрите на имя автора. Вы слышали о них? Знаете ли вы, цитируются ли они в других книгах на эту тему? Ваш преподаватель упомянул имя автора? Связаны ли они с университетом? Признают ли они организационную принадлежность?

На большинство из этих вопросов можно ответить, прочитав благодарности и предисловия к книгам , но вам может потребоваться провести базовое исследование, чтобы узнать больше об авторе. Один из самых простых способов сделать это — просто ввести свое имя в Google и посмотреть, что появится.

Из этой информации вы часто можете сказать, какова их профессия и другие связи.


Вопросы, которые вы будете задавать об издателе , аналогичны тем, которые задают об авторе. Посмотрите на первых нескольких страницах книги информацию об авторских правах и издателе.

Текст был опубликован в университетской прессе? Опубликовала ли это популярная пресса? Вы можете быть относительно уверены, что, если университетское издательство опубликовало книгу, она соответствует высоким академическим стандартам.

Популярные прессы отличаются своими стандартами. Возможно, вам придется взглянуть на другие аспекты книги или просмотреть другие книги, выпущенные тем же издателем, чтобы оценить достоверность текста.

Помните, что вы не ищете способов исключить работы. Скорее, вы пытаетесь понять контекст, в котором была написана книга, чтобы лучше анализировать ее содержание.

Дата публикации

Если вы изучаете текущую проблему, само собой разумеется, что вам нужны самые свежие источники, которые вы можете найти.

Если ваша тема не так актуальна, часто приемлемо вернуться к источникам на десять или даже двадцать лет назад.

Если есть более поздняя книга на ту же тему, обязательно посмотрите ее. Может быть, автор нашел новые доказательства, кардинально меняющие аргументацию первой книги.

Возраст произведения определить легко, но иногда это бывает непросто. Страница, содержащая всю информацию об издателе, имеет дату авторского права. Произведение переведено? Если да, то эта дата, вероятно, является датой перевода. На странице указано более одной даты? В этом случае у вас, вероятно, есть более новая версия, в которую может быть добавлена ​​новая информация.

По следу

Может случиться так, что вы придумали тему и пойдете в библиотеку искать исходники. Вы садитесь с десятью книгами и подвергаете все десять книг шагам критического анализа, описанным выше, и только одна из них соответствует всем вашим критериям.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *