Средняя длина языка

Если Вы человек творческий и часто сочиняете тексты, то наверняка сталкивались с ситуацией, когда в предложении приходится несколько раз употреблять один и тот же термин или слово. Но при множественном его использовании в предложении теряется читабельность текста. Тогда к нам на помощь приходят слова — синонимы.

Словарь синонимов тришина

В виртуальной сети, конечно же, можно найти любое слово и синоним к нему. Но, если Вы хотите постоянно иметь под рукой словарь синонимов русского языка, то с ресурса http://www.trishin.ru можно скачать и установить к себе на компьютер совершенно бесплатно Большой словарь-справочник синонимов русского языка системы ASIS® В.Н.Тришина. Последняя версия словаря под номером 6.9, написанная на языке Visual Fox Pro, содержит в своей базе данных 508 тысяч слов и выражений, из которых 390 тыс. снабжены синонимами, квазисинонимами, поясняющими словами (сходными по смыслу выражениями). Всего синонимов в словаре около двух миллионов. Электронный словарь Вы можете использовать также в качестве орфографического и толкового словарей русского языка и проверять правильность написания того или иного незнакомого слова и определения его значения.

База электронного словаря включает слова со всех отраслей знаний, начиная от астрономии и заканчивая японской живописью. При его составлении разработчик использовал изданные в XIX-XXI веках орфографические, синонимические, толковые словари, словари фразеологических синонимов, церковно-славянских и иностранных слов. Для пополнения словаря также использовались газеты, журналы и самые разнообразные интернет-ресурсы.

Есть версия словаря 8.3 от 21 марта 2013, написанная на языке C# в среде разработки Microsoft Visual Studio 2008 и содержащая 489 тыс. слов и словосочетаний, из которых 378 тыс. снабжены синонимами, квазисинонимами (сходными по смыслу выражениями), 1863 тыс. синонимических связей. Данная версия имеет более мощную поисковую систему и простую установку. Правда в ней нельзя добавлять слова, но, кажется, нам этого и не надо.

Мне более симпатична версия словаря, написанная на языке C# и, поэтому я установлю именно ее. Для этого скачиваем дистрибутив с вышеуказанного сайта и, после разархивации, запускаем файл DictonarySetup.exe. После ознакомления с лицензионным соглашением Мастер установки попросит Вас подтвердить или изменить место установки файлов электронного словаря. Если Вас устраивает папка, предложенная по умолчанию, нажимаем на кнопку Далее и после установки приложения закрываем окно Мастера установки.

После всех действий по установке, Вы можете приступить к запуску и работе со справочником!

Источник: Большой словарь-справочник синонимов русского языка

Вышла новая версия словаря синонимов русского языка В. Н. Тришина

Состоялся релиз версии 7.1 синонимического словаря-справочника русского языка системы ASIS, разрабатываемого под руководством выпускника Московского физико-технического института, кандидата физико-математических наук Виталия Тришина.

Представленная сборка приложения отличается от прежних редакций расширенной словарной базой (408 тыс. слов и выражений, 1698 тыс. синонимов), обновленным пользовательским интерфейсом, улучшенными средствами поиска слов, а также исправленными ошибками и неточностями в словарной базе. Новая версия словника написана на языке C# в среде разработки Microsoft Visual Studio 2008 и лишена функции добавления слов в базу данных (для этой цели планируется выпуск соответствующей утилиты).

Словарь-справочник системы ASIS первоначально разрабатывался с 1993 года как часть одноименной платформы помощи оценщику и аудитору. В процессе развития словарь приобрел самостоятельное значение и в настоящее время распространяется отдельно от упомянутой системы на безвозмездной основе. Функционал продукта позволяет использовать приложение не только как словарь синонимов и близких по смыслу слов, но и в качестве орфографического и толкового словарей русского языка с целью проверки правильности написания и определения значений незнакомых слов.

Скачать дистрибутив словаря для платформы Windows и получить дополнительные сведения о продукте можно на странице trishin.ru/left/dictionary. Для корректной работы программы необходим установленный в системе компонент .NET Framework, позаимствовать который можно с сайта компании Microsoft.

При подсчёте звуков, например, английскую лигатуру ch надо считать за один звук. И здесь проявляется ещё и то, что для родного то языка письменность отлажена на протяжении веков, а иностранная речь транслитируется чёрт знает как. Ну нет в русском трёх вариантов звука «э», но открытые и закрытые слоги и лигатура er уже предусмотрены, усложняя письмо, при этом статистическая частота звука отличается от английской. Русские мягкий и твёрдый знак тоже часто ли применяются? На сколько мне известно, их даже договариваются убирать в сторону перед тем, как сыграть в «эрудит». Кроме того, отдельное слово в большинстве случаев не несёт информации. Исключением являются во-первых полисинтетические языки. Во-вторых исключением может быть ответ в тех случаях, когда все остальные слова ответа кроме одного заключены в вопросе. В-третьих исключением является приказ о немедленном начале действия в тех случаях, когда смысл передан заранее (сначала распределены цели, а потом короткое «огонь»). В-четвёртых команды вроде «равняйсь», смысл которых также определён заранее, по сути являющиеся скорей кодами, чем словами. Поэтому считать надо среднее не в слове, а в предложении, или даже в группе предложений. И вот здесь английский проигрывает из-за огромного количества вспомогательных слов. В русском даже глагол «быть» (to be) применяется только когда действительно нужен для передачи смысла, в английском он встроен в структуру предложения и отличает, например, утвердительное предложение от вопросительного, для чего в русском языке достаточно интонации, а на письме — знака препинания в конце предложения. А ещё артикли. Например, «the» — это не «этот», а «конкретный». А какой именно? Тот? Или этот? А чёрт его знает, в слове «the» заложен лишь один бит, указывающий на то, что различие между тем и этим важно. А какой именно указывается отдельно. А зачем артикль? Русское «этот» соответствует не «the», а «this» и содержит больше информации, а слово «конкретный» (как раз соответствующее «the») вообще из числа редчайших. Даже русские клитики (вроде частицы «же») применяются лишь для большей выразительности. Да и без слова «например» в бою можно обойтись.

Индекс удобочитаемости

Индекс удобочитаемости — мера определения сложности восприятия текста читателем. Индекс удобочитаемости может вычисляться на основе нескольких параметров: длины предложений, слов, удельного количества наиболее частотных (или редких) слов и т. д.

Индекс удобочитаемости Флеша

Наиболее популярная мера была создана Рудольфом Флешем, изначально для английского языка. Она оценивает сложность текста по следующей формуле

F R E = 206,835 − 1,015 total words total sentences − 84 , 6 total syllables total words , {\displaystyle FRE=206{,}835-1{,}015{\frac {\text{total words}}{\text{total sentences}}}-84{,}6{\frac {\text{total syllables}}{\text{total words}}},}

или

FRE = 206,835 − 1,015 × ASL − 84,6 × ASW,

где:

ASL — средняя длина предложения в словах (англ. average sentence length), ASW — средняя длина слова в слогах (англ. average number of syllables per word).

Индекс по шкале FRES (англ. Flesch reading ease scale) распределяется таким образом:

100: Очень легко читается. Средняя длина предложения составляет 12 или менее слов. Нет слов из более чем 2 слогов. 65: простой английский язык. Средняя длина предложения составляет от 15 до 20 слов. В среднем слова имеют 2 слога. 30: Немного трудно читать. Предложения содержат до 25 слов. Обычно, двусложные слова. 0: Очень трудно читать. В среднем предложение имеет 37 слов. Слово имеет в среднем более 2 слогов.

Для английского языка значение 90—100 соответствует лёгкому тексту для младших школьников, 60—70 — тексту, который могут читать выпускники школы, тексты с индексом 0—30 предназначены для людей с высшим образованием.

В связи с тем, что в русском языке средняя длина предложения меньше (за счёт меньшего использования служебных слов, таких как артикли или вспомогательные глаголы), а слова в среднем длиннее, было предпринято несколько попыток разработать специфическую для русского языка версию меры, например, путём подгонки коэффициентов при сравнении индексов, полученных для оригинальных английских текстов и их переводов. Ниже представлен один из вариантов такой адаптации:

FRE = 206,835 − 1,3 × ASL − 60,1 × ASW.

В целом, большинство методов оценки сложности текста на основе индексов удобочитаемости для информационно-аналитических документов на русском языке дают оценки, выходящие как за интерпретируемый диапазон значений, так и за эталонные значения. При этом получаемые результаты характеризуются высокой степенью корреляции, так как разработчики используют одну математическую модель линейной регрессии, а также однообразные параметры текста (средняя длина слова, средняя длина предложения). При этом индексы удобочитаемости не адаптированы к тестам для взрослых. У профессионала не должно возникать затруднений с пониманием многосложных слов. В конечном итоге фактором сложности выступает семантика текста и абстрактность его изложения. Индикаторы на основе индексов удобочитаемости недостаточно хорошо интерпретируются, поскольку не могут напрямую быть использованы для прогнозирования времени обработки текста тем или иным человеком.

Примечания

  1. Edit Central
  2. Rudolf Flesch (1948). A new readability yardstick, Journal of Applied Psychology, 32, С. 221—233.
  3. Оборнева И. В. (2005). Автоматизация оценки качества восприятия текста (недоступная ссылка). ВЕСТНИК Московского городского педагогического университета, 2(5).
  4. Мизернов И. Ю., Гращенко Л. А. (2015). Анализ методов оценки сложности текста. Новые информационные технологии в автоматизированных системах, 18, С. 572—581.

Сколько примерно слов в мировых языках (русский, английский, китайский и т.д.)?

Alexander Shaduri 2939 3 года назад Переводчик-синхронист, руководитель агентства переводов, спикер TEDx АВТОР ВОПРОСА ОДОБРИЛ ЭТОТ ОТВЕТ

Точное число, безусловно, назвать невозможно по целому ряду причин. Но приблизительные данные лингвистами давно обобщены и проанализированы. Напишу о двух языках, с которыми я работаю больше всего.

Английский. Большинство лингвистов сходятся на мнении, что в языке Шекспира и Диккенса примерно 1 миллион слов. В зависимости от того, как именно и что именно считать, примерная погрешность составляет «до четверти миллиона». Словарь Webster’s Third New International Dictionary, Unabridged содержит 470 000 словарных статей (не слов, обратите внимание). The Oxford English Dictionary, Second Edition — примерно столько же.

Русский язык. В словаре Ожегова более 70 000 слов. В словаре Ушакова — более 90 000. БТС содержит примерно 130 000 слов. Эти цифры покрывают, по данным исследований, примерно 50% всех слов, зафиксированных в большой словарной картотеке (БСК) Института лингвистических исследований РАН (ИЛИ РАН). Это позволяет, опять же, примерно, оценить общее число.

Для сравнения, активный словарный запас среднего человека, для родного языка, составляет ~8 000 слов. Пассивный — 20 000 -35 000. Это с учетом таких слов как названия брендов, например «Кока-кола» или «Эппл». Если говорить о верхнем пределе для активного словаря, Шекспир, общепризнанный гений и один из лидеров по количеству употребляемых в его произведениях слов обладал по разным оценкам активным словарем в 15-20 тысяч слов. В 1974 году с помощью компьютера в его произведениях было найдено 29 066 уникальных слов.

militaryhistory

При анализе Второй мировой войны американские военные историки обнаружили очень интересный факт. А именно, при внезапном столкновении с силами японцев американцы, как правило, гораздо быстрее принимали решения — и, как следствие, побеждали даже превосходящие силы противника. Исследовав данную закономерность, учёные пришли к выводу, что средняя длина слова у американцев составляет 5.2 символа, тогда как у японцев 10.8. Следовательно, на отдачу приказов уходит на 56% меньше времени, что в коротком бою играет немаловажную роль. Ради «интереса» они проанализировали русскую речь — и оказалось, что длина слова в русском языке составляет 7.2 символа на слово (в среднем), однако при критических ситуациях русскоязычный командный состав переходит на ненормативную лексику — и длина слова сокращается до (!) 3.2 символов в слове. Это связано с тем, что некоторые словосочетания и даже фразы заменяются одним словом. Для примера приводится фраза:
32-ой — приказываю немедленно уничтожить вражеский танк, ведущий огонь по нашим позициям —
32-ой — ёбни по этому хую!
http://www.livejournal.ru/themes/id/43813

Синонимы к слову «анализ»

Введите слово и нажмите «Найти синонимы». Поделиться, сохранить:

Найдено 50 синонимов. Если синонимов недостаточно, то больше можно найти, нажимая на слова.

Синонимы строкой Скрыть словосочетания
Предложения со словом «анализ». Значение слова
Антонимы «анализ»
,

Синоним, количество Начальная форма Частота
1 разбор полетов (3) 204.3
2 исследование (73) исследование 200.5
3 оценка (53) оценка 161.4
4 рассмотрение (25) рассмотрение 61.4
5 обсуждение (36) обсуждение 51.3
6 критика (28) критик, критика 44
7 обзор (24) обзор 18
8 разбирательство (17) разбирательство 16
9 разбор (28) разбор 11.9
10 разложение (47) разложение 6.7
11 психоанализ (1) психоанализ 2.3
12 самоанализ (6) самоанализ 0.7
13 самокопание (3) самокопание 0.4
14 фотоанализ (2) фотоанализ
15 учитывание (9) учитывание
16 макроанализ (1) макроанализ
17 микроанализ (2) микроанализ
18 разбирание (48) разбирание
19 рентгеноанализ (1) рентгеноанализ
20 допинг-анализ (1) допинг-анализ
21 ДНК-анализ (3) ДНК-анализ
22 доанализ (1) доанализ
23 гамма-анализ (1) гамма-анализ
24 аллергоанализ (1) аллергоанализ
25 эккаунтинг (3) эккаунтинг
26 наркоанализ (1) наркоанализ
27 метаанализ (1) метаанализ
28 лингвоанализ (1) лингвоанализ
29 нефанализ (1) нефанализ
30 видеоанализ (1) видеоанализ
31 умоизлияние (4) умоизлияние
32 матан (4) матана, матаный, матать
33 иммуноанализ (1) иммуноанализ
34 метеоанализ (1) метеоанализ
35 копрограмма (1) копрограмма
36 электроанализ (1) электроанализ
37 КРА (42) кр
38 матанал (1) матанал
39 криптоанализ (2) криптоанализ
40 химанализ (2) химанализ https://sinonim.org/
41 баканализ (1) баканализ
42 тест-анализ (1) тест-анализ
43 матанализ (2) матанализ
44 газоанализ (1) газоанализ
45 блицанализ (2) блицанализ
46 биоанализ (1) биоанализ
47 термоанализ (1) термоанализ
48 экспресс-анализ (2) экспресс-анализ
49 агрохиманализ (2) агрохиманализ
50 зооанализ (1) зооанализ

С тем же началом: анализирование, анализируемый, анализатор, анализация, анализирующий

С таким же концом: самоанализ, провести анализ, проведен анализ, сравнительный анализ, психоанализ

Другие слова на букву а

Синонимы к словам и словосочетаниям на букву:
А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ы Э Ю Я

Поделитесь, если помогло

Наверх На главную

  • Средняя частота слова «анализ» на миллион употреблений: 157 раз. Количество букв: 6.
  • Поиск занял 0.004 сек. Вспомните, как часто вы ищете, чем можно заменить слово? Добавьте sinonim.org в закладки, чтобы быстро искать синонимы, антонимы и предложения (нажмите Ctrl+D), ведь качественный онлайн словарь синонимов русского языка пригодится всегда.

Случайные слова и фразы: сочетанный, масличный, делавший наподобие

анализ

Примеры предложений со словом анализ

  • Более того, как показывает анализ, в некоторых случаях продуктивен такой порядок познания явлений, который прямо противоположен их реальной последовательности (например, когда ученый изучает результат процесса изменения или развития и на основе этого реконструирует исходный пункт процесса, который он лишен возможности непосредственно изучать) или в принципе не может ей соответствовать (например, когда устанавливается генетическая связь предметов, один из которых возник из другого, путем последовательного сопоставления их друг с другом).
  • Ackerman, “Digging up Deborah,” 172–184, берет за основу исследования Кэрол Мейерс, с их анализом библейских и внебиблейских (археологических, социологических, этнографических, сравнительных семитологических) данных, и пытается доказать, что «в домонархическую эпоху древнеизраильской истории женщины глубоко участвовали в экономических, социальных, политических и религиозных делах общества» (с.
  • Посильный вклад в дело победы в Великой Отечественной войне внесли и работники экономической службы, особенно те из них, кто был непосредственно связан с учетом, контролем и анализом производственной деятельности, с изысканием резервов сокращения затрат, снижения себестоимости выпускаемой продукции.

Все предложения со словом анализ

Какова средняя длина слова в русском языке?

Леонид Делицын 1191 4 года назад Сотрудник группы компаний ФИНАМ

Средняя длина слова составляет около 6 букв, но зависит от корпуса (набора) текстов. Для корпуса русской разговорной речи средняя длина слова обычно составит от 3.9 до 4.9 букв. Для корпуса русской художественной литературы — от 4.9 до 5.9. Для газетно-новостного-корпуса — от 5.9 до 6.9. И наконец, для корпуса научной и деловой литературы — от 6.9 до 7.9 букв. Если вы составите корпус так, чтобы каждый из четырёх указанных видов (функциональных стилей) входил поровну (например, по миллиону слов), то получите, что в среднем слове 6 букв (точнее, 5,9). Но можно возразить, скажем, что научная и деловая речь встречается реже, и уменьшить её долю. Например, если заявить, что такой речи у нас больше нет, и уменьшить её долю до нуля, то средняя длина слова тоже уменьшится до 5.5 букв.

Можно воспользоваться скриптом «худломер», который я написал в конце 90-х, и вычислить среднюю длину слова в интересующем вас тексте, кроме того, худломер определит функциональный стиль текста (используя те цифры, что я привёл выше). См. тут: http://anti.teneta.ru/hudlomer/

Что у нас с БАСом?

Как считают словарный запас? Почему Оксфордский словарь такой толстый?

Людмила Кругликова: Лингвисты избегают такого рода сравнений между языками и словарями. У каждого своя специфика. Скажем, в Вебстеровский словарь в качестве самостоятельных статей включаются символы, например, химических элементов: B (бор), Ba (барий), Be (бериллий), Br (бром) и так далее, сокращенные наименования мер длины, веса, объема: km (километр), kg (килограмм), bbl (баррель)… Мало того, толковые словари английского языка начали включать символы обозначений размеров листов бумаги: А3, А4, А5, а также, например, символ @.

Поэтому вывод о бедности русского языка и богатстве английского на том основании, что Большой академический словарь русского языка (БАС), который начал выходить в 2004 году (опубликовано 22 тома из предполагаемых 33), будет содержать 150 000 слов, а Оксфордский (Тhe Oxford English Dictionary, сокращенно OED) — 600 000, не что иное, как обман. БАС отражает лексику только современного литературного языка, а Оксфордский словарь — слова всех разновидностей и всех вариантов (американского, канадского и т.д.) английского языка начиная с 1150 года, включая мертвые.

А сколько слов в русском языке, если считать по-английски?

Людмила Кругликова: Если мы добавим к 150 000 слов современного русского литературного языка, например, еще и диалектные слова, то получим уже 400 000 слов…

Как объяснить тот факт, что один из самых известных английских словарей Вебстеровский стал резко худеть, и время «похудения» пришлось на Вторую мировую войну и начало «холодной»?

Людмила Кругликова: Не стоит искать в лингвистических процессах какую-то политику. Вебстеровский словарь, появившийся в 1909 году, содержал 400 000 английских слов. В его втором издании (1934 год) содержится 600 000 слов, в третьем (1961 год) — 450 000 слов. На основании этого можно заявить, что с 1934 года началось катастрофическое вырождение английского языка. А причина таких резких скачков всего лишь в том, что у второго и третьего изданий были разные редакторы, а у них разные принципы подхода к отбору слов.

На сайте издательской фирмы Merriam-Webster сказано: «Считается, что словарь английского языка включает примерно миллион слов». Это честная цифра?

Людмила Кругликова: Большинство лингвистов восприняло такую оценку с долей юмора, а некоторые сказали, что они не были бы удивлены, если бы он оценивался в четверть миллиона.

Откуда тогда взялся миллион?

Людмила Кругликова: Начиная с 2006 года некто Дж. Дж. Паяк, специалист по маркетингу и аналитике, основатель компании Global Language Monitor неоднократно заявлял о том, что скоро будет зафиксировано миллионное слово английского языка. Таким словом стало, по версии Паяка, «Web 2.0», которое является техническим термином. Кстати, уже есть и Web 3.0, а в Сети идет речь о скором появлении Web 4.0, Web 5.0. Если включать все подобные образования, то скоро можно будет говорить о миллиардном слове английского языка.

Как англичане и американцы относятся к таким сенсациям?

Людмила Кругликова: Приведу высказывание Нунберга, лингвиста из Школы информации в Калифорнийском университете в Беркли: «Наше восхищение необъятностью английского языка возникает из своего рода лингвистического империализма — ощущения, что «наши словари больше, чем их словари». Но это на самом деле не делает нас сколь-либо богаче лингвистически».

Но и среди исследователей «великого и могучего» есть лингвистические пессимисты, которые считают, что корни русского языка «бесплодны»: не рождают новых слов, а большинство неологизмов имеет иностранное происхождение…

Людмила Кругликова: Лингвист и философ Михаил Эпштейн утверждает, что в XIX веке было 150 слов с корнем «люб», а наши современники знают в три раза меньше. Между тем в «Словообразовательном словаре русского языка» Тихонова, насчитывающем около 145 000 слов современного русского литературного языка, имеется 310 слов с корнем «люб». А если считать начиная с первых памятников письменности, то получится 441 слово. В английском языке, по данным OED, только 108 лексем с аналогичным корнем (love) в начале слова.

Новые слова «про любовь» современные россияне производят?

Людмила Кругликова: В начале ХХ века появилось существительное «книголюб», а затем «природолюб», «однолюбка», «любовь-игра», «любовь-ненависть», «любовь-морковь», «безлюбье». При беглом просмотре я насчитала не менее 40 слов с корнем «люб», которые появились в XX — начале XXI века. В английском языке с корнем (love) только пять единиц вошло в язык в ХХ веке (с 1907 по 1989 год), а после этого времени ни одной.

Насколько активны сейчас наши соотечественники в политическом словотворчестве?

Людмила Кругликова: В этом отношении весьма интересно читать комментарии в Интернете. События на Украине вызвали к жизни такие лексемы, как майдауны, майданутые, онижедети, укры, укропы, псакинг, Фашингтон, Гейропа и другие. Приживутся они или нет, покажет время.

Наши депутаты периодически восстают против заимствований. Где их критический предел в языке? 70% — катастрофично?

Людмила Кругликова: По подсчетам лингвистов, во втором издании Вебстеровского словаря только 35% исконных английских слов, остальные 65% — заимствования. Но пока ничего катастрофического не случилось. Русский язык действительно испытывает большое влияние английского. Но обогащение его англицизмами наблюдается прежде всего в сфере необщенародной лексики, среди которой преобладают термины из области спорта, компьютерного дела, экономики, финансов. Плохо, если они начинают влиять на структуру языка. С русским этого не происходит. Иноязычные слова подстраиваются под систему, заимствованные корни обрастают русскими аффиксами, например: постить, смайлик, океюшки, лайкать и даже облайканный.

За 10 лет работы над БАСом сделано 22 тома — это две трети работы. Вас не упрекают за медлительность?

Людмила Кругликова: Над БАСом работают 5 штатных лингвистов, 3 совместителя и несколько сотрудников издательства. В год выходит в среднем по два тома. Над Оксфордским словарем работают 78 лингвистов, 46 внештатных сотрудников, а также 200 консультантов, штат программистов, маркетологов. Когда в нью-йоркском офисе Оксфордского словаря узнали о наших темпах работы мизерными силами, то план работы их сотрудников увеличили, а главного редактора отправили на пенсию.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *