Open
Close

Что у нас с БАСом? Сколько слов существует в русском языке.

Пожалуй, ни один академик не ответит вам точно на вопрос, сколько в русском языке слов. Просто никому еще не удалось их точно подсчитать, ибо живой русский язык содержит не только литературные нормы, но и изобилует диалектизмами, профессионализмами и жаргонизмами. Язык постоянно развивается, пополняясь все новыми и новыми словами и формами. Но примерную оценку все же можно сделать…

Кроме того, ученые расходятся в методологии подсчета. Так, например, в Великобритании в справочные издания, такие как Оксфордский или Вебстеровский словари, принято включать в абсолютно все. Там можно найти даже статьи по символам (в том числе обозначение химических элементов, сокращения мер веса, длины и других физических величин, форматы бумаги и т.д.) и специальные термины (например, «WEB 2.0» - это отдельная статья!). В российской научной традиции в словари включаются только полноценные лингвистические единицы литературного языка.

Самым авторитетным отечественным изданием, по которому можно судить о емкости языка, является Большой академический словарь, первое издание которого вышло еще в советские годы. Он насчитывает 131 257 слов русского литературного языка. Сейчас идет работа над новым изданием этого справочника, которое будет содержать уже около 150 000 слов. Дореволюционный словарь В.И.Даля насчитывает более 200 000 слов.

По оценкам профессиональных лингвистов, если к этому добавить диалектизмы, то получится уже более 400 000 слов. Если же еще учесть профессиональные термины, неформальные единицы и новообразования, то число слов перевалит далеко за полмиллиона!

Язык – это живая система. Некоторые слова «умирают», выходя из употребления полностью или оставаясь лишь в литературных произведениях. Но на их место приходят новые. Например, в XX-начале XXI веке русский язык обогатился не менее чем на 40 слов только с корнем «люб»: «книголюб», «природолюб», «однолюбка», «любовь-игра», «любовь-ненависть», «любовь-морковь», «безлюбье» и другие. Новые веяния приносят в нашу жизнь и новые слова, которые образуются либо на основе уже существующих русских лингвистических единиц, либо путем русификации иностранных заимствований: «постить», «смайлик», «океюшки», «лайкать» и т.п.

А вот считать заимствования в любом языке – дело совершенно неблагодарное. За всю историю человечества большинство языков подверглись (и подвергаются до сих пор) очень существенному взаимному влиянию. В русском языке огромное количество заимствований из скандинавских, балтийских, тюркских, арабских, европейских языков и наречий, и, конечно, из латыни и греческого. Некоторые слова были заимствованы так давно, что воспринимаются исконно русскими. А между тем, даже «деревня», «боярин», «кувшин», «ларь», «кнут», «сахар», «свёкла», «фонарь», «телега», «руль», «ботинок» и многие-многие другие – это заимствования из других языков.

Английский язык, из которого сегодня идет наибольший поток заимствований в другие языки, тоже не эталон чистоты. В Вебстеровском словаре только 35% исконных английских слов, остальные 65% - заимствования.

Говорить о «бедности» или «богатстве» какого-либо распространенного языка не совсем корректно. Например, английский и русский языки в целом сопоставимы по количеству слов (лингвисты оценивают реальную емкость английского языка примерно в 470 тыс. слов). Вопрос лишь в их применимости и частоте употребления, а также размере словарного запаса у среднего носителя языка.

В русском языке, согласно «Частотному словарю русского языка» под редакцией Л. Н. Засориной , наиболее употребительными являются около 30 тысяч слов, а наибольшую частоту имеют чуть более 6 тысяч слов. А самых-самых распространенных в повседневной речи – около 2 500 тысяч.

В лексиконе классика русской литературы А.С.Пушкина было примерно 21 тысяча слов (столько насчитали в его произведениях, включая не только основные лексемы, но и производные от них: лист-листик-листочек и т.д.). Словарный запас обычного человека оценивается по-разному. Единства в методике подсчета и результатах нет. Есть противоречивые данные, что словарный запас выпускника школы составляет от 3 000 до 40 000 слов. А у человека с высшим образованием – от 7 000 до 80 000 слов. При таких подсчетах надо учитывать, что словарный запас подразделяется на активный и пассивный. Активный запас состоит из тех, слов, смысл которых человек понимает и использует их в речи, а пассивный – из тех, что понимает, но на практике не пользуется.

Вы сами можете пройти один из тестов на определение пассивного словарного запаса по этой ссылке http://www.myvocab.info/ Для чистоты эксперимента советуем сделать это пару раз. О результатах пишите в комментариях к посту.

P.S. Если у вас есть интересные материалы, справки, советы, лайфхаки абсолютно по любой теме, то присылайте их на почту проекта #Ликбез Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript .

Трудно. К примеру, в словаре С. И. Ожегова только самых употребительных слов насчитывается около 57 тысяч. Еще можно обратиться к наиболее авторитетному из существующих словарей - Большому академическому, который содержит целых 17 томов. Список языка в этом библиографическом издании насчитывает 131 257. Кстати, в 1970 году сей труд был отмечен Ленинской премией, но, к сожалению, быстро стал редкостью. Заменил его слегка устаревший, но популярный словарь Даля.

Несмотря на столь точное число, мы не можем утверждать, что ответ на вопрос о том, сколько слов в русском языке, дан правильно. Скорее, этот ответ будет условен из-за большого количества оговорок, которые способны запросто изменить данное количество слов. Лишь стоит добавить к для составления наречия, как слов станет еще больше, скажем, примерно на несколько десятков тысяч. К примеру, от прилагательного "откровенный" образуем наречие "откровенно". В словаре это наречение не указано самостоятельной единицей.

Стоит добавить, что в словаре указаны только слова из языка литературного, то есть нормированного, а ведь еще есть слова общенародного русского общения! Язык богат огромным количеством существительных и прилагательных, бытующих в сельских местностях, в которых очень большое разнообразие самых невероятных Попробуйте догадаться, что "потка" в вятских селах обозначает птицу! А глагол "нухрить"? Сразу и не скажешь, что с вологодского диалекта сей перл переводится как "искать". Конечно, в некоторых словарях такие слова указаны, даже были написаны специализированные диалектные словари для той или иной области. Но ни один словарь не в состоянии абсолютно точно ответить на вопрос о том, сколько слов в русском языке.

Хорошо, оставим пока диалектизмы в покое. Они не так уж часто встречаются в литературном языке, разве что в некоторых художественных произведениях для придания им особого настроения и интересного повествования.

Давайте вспомним отдельную группу слов в русском языке, которую не удается найти ни в одном словаре, хотя все они общеизвестны и повсеместно употребляются. К ним относятся, как правило, термины, неологизмы, имена собственные и другие разряды слов. Например, аббревиатура "РАН" - Российская Академия Наук. Не подсчитаешь, сколько раз это название используются в каких-нибудь новостях или научных сводках. Однако в Большом академическом словаре данное сокращение отсутствует. Как и иноязычное, но такое родное слово "компьютер" - современный символ информационно-насыщенной жизни. Впрочем, всех его производных также нет ни в одном из словарей.

Очевидно, что иноязычные слова в русском языке стали очень употребляемы в последние десятилетия. Хотели было выпустить обновленный Большой академический словарь в 20-ти томах, но... После четвертого было ясно, что смысла это не имеет ни малейшего. Новые и новые слова постоянно появляются в нашем языке. При общении в Интернете, просмотре телепередач или чтении специализированных журналов - везде вы увидите свой собственный набор слов и кое-где, возможно, сленг.

Так сколько слов в русском языке на самом деле? Очень, и еще раз очень большое количество. Каждое из них по-своему видоизменяется, появляются новые слова, их производные. Язык живет своей собственной жизнью, подчиняясь современному веянию и течению времени.

Затасканный штамп про «великий и могучий» пересмотру пока что, слава богу, не подлежит. Все верно: и великий, и могучий. Это подтверждают и те иностранцы, которые хорошо владели нашим языком. Например, французский современник Пушкина Проспер Мериме писал: «Русский язык, насколько я могу судить о нем, является богатейшим из всех европейских наречий и кажется нарочно созданным для выражения тончайших оттенков. Одаренный чудесной сжатостью, соединенный с ясностью, он довольствуется одним словом для передачи мысли, когда другому языку потребовались бы для этого целые фразы».

Но, увы, состояние русского языка по итогам ХХ века вызывает у ученых тревогу. Наряду с падением рождаемости в стране происходит и обеднение словарного запаса. Если словарь Владимира Даля содержал 200 тысяч слов, то во всех словарях русского языка, изданных на протяжении последних 70 лет, их число колеблется в пределах 125-130 тысяч слов. По самым щедрым оценкам – не более 170 тысяч.

Но это очень мало для развитого языка, с великим прошлым и, надо надеяться, большим будущим. Для сравнения: в современном английском - примерно 1,5 миллиона слов . В современном немецком языке, по разным подсчетам, от 185 до 300 тысяч слов.

Но даже это не такое уж несметное словесное богатство лежит у нас мертвым грузом. Число наиболее употребительных слов в разных стилях и жанрах составляет всего около 40-50 тысяч. А словарный запас более менее образованного «простого смертного» оценивается в среднем и вовсе в 3-5 тысяч слов. Некоторые особи, как известно, легко обходятся тридцатью словесами.

Ну, а сколько слов использовали наши классики? Известно, например, что Пушкин употребил в сочинениях и письмах 21 290 разных слов. Имеются данные и о количестве слов у других писателей: Гоголь (только в «Мертвых душах») - около 10 000 слов, Есенин - 18 890. Но рекордсменом здесь является (что, безусловно, большая неожиданность) Владимир Ильич Ленин. В своих произведениях и письмах он употребил свыше 37 500 слов. Правда, среди них есть множество таких, которые Пушкину и не снились: архиважно, эмпириокритицизм, марксизм, интернационал, Рабкрин и т.п.

Но факт остается фактом. Вот уж поистине: я русский бы выучил только за то…

Солженицын, составивший «Русский словарь языкового расширения», полагал, что в современном литературном языке возможно оживить еще около 40-50 тысяч слов, которые считаются устаревшими и диалектными. Так что какой-никакой запас у нас теоретически вроде бы есть. На практике же все "обогащение" русского языка последних десятилетий происходит за счет усвоения и переделки иностранных слов и понятий. Свои "родные" неологизмы - это в абсолютном большинстве жаргонизмы и вульгаризмы.

Странно, что наше внутреннее ощущение богатства русского языка так не соответствует его фактической бедности.

Согласно устоявшемуся мнению, слово можно охарактеризовать как совокупность букв, находящуюся между двумя пробелами. Но если взять, к примеру, язык гренландских эскимосов, то в нем считается целое предложение. Есть проблемы и в менее экзотических языках. К примеру, чешский язык предполагает слитное написание частицы «не» с , в турецком языке данное отрицание находится в центре слова. Таким образом, по нашим правилам получается, что каждое слово с находящимся в нем отрицанием стоит считать отдельно.

Возникает вопрос: как быть со словами, имеющими различные окончания (к примеру, «красивый», « », «красивое»), а также омонимами - например, замок как строение и замок как устройство? Можно ли засчитать как отдельные слова – КВН, КГБ, ОВД и т.п.? В каждом языке существует десятки тысяч подобных подвохов.

Еще более каверзными являются вопросы, касающиеся того, что именно считать языком. Могут ли различные говоры и диалекты относиться к отдельным языкам или это основного? Например, в Африке и Европе часто случается так, что невозможно сразу определить, какой язык для отдельно взятого диалекта является основным. Да и можно ли однозначно утверждать, к какому из языков относятся некоторые слова? К примеру, «атаман» или «хата» – это украинские или все же русские слова? К какому языку можно отнести слова «сайт», «сервер», «провайдер» – русскому, английскому, немецкому или всем сразу?

Поэтому стоит ограничиться лишь общими подсчетами, не претендующими на научность. Что касается русского языка, то в нем, по мнению лингвистов, содержится около 500000 слов. Это число приблизительное и не включает в себя специальных научных терминов. Зато здесь имеются устаревшие, заимствованные из других языков, сложные слова, ласкательные, уменьшительные формы и другие. Если обратиться к авторитетному Большому академическому словарю, состоящему из семнадцати томов, то в нем окажется 131 257 слов. Однако следует учитывать, что годом его издания является 1970, а русский язык за последние 40 лет претерпел множество изменений и значительно обогатился такими понятиями, как, например, «перестройка», «интернет» и т.д.

Что касается английского языка, по данным мониторинга Global Language Monitor, в 2009 году число слов превысило в нем цифру в один миллион и продолжает увеличиваться. Причем миллионным словом стало «Web 2.0». По данным авторитетных словарей, английский язык также опережает русский. Например, в 3-ем издании Вебстеровского словаря содержится 450000 слов, в Оксфордском – примерно 500000.

Особый интерес представляют иероглифические языки, в которых отдельным символом обозначается не буква, а целое слово. В этом случае прямые сравнения вовсе невозможны. Однако если провести сравнение по словарям, такие языки, к всеобщему удивлению, сильно проигрывают. Например, в наиболее полном японском словаре содержится 50000 иероглифов. Но Министерство просвещения Японии утвердило для повседневного использования лишь 1850 иероглифов. Китайский язык содержит около 80 тысяч иероглифов. Но реально здесь также используется намного меньше. Утвержденный в 1981 году госстандарт «Основной набор иероглифов» включает 6763 иероглифа.

В количественные лидеры неожиданным образом попадает итальянский язык. В нем все составные числительные пишутся прописью слитно, в одно слово. Числовой ряд, как известно бесконечен, поэтому получается бесконечным и количество слов итальянского языка.

В Оксфордском словаре в четыре раза больше слов, чем в БАСе - Большом академическом словаре русского языка. "Великий и могучий" полон английских заимствований. Школьники перестали понимать Пушкина. Что происходит с русским языком? Рождает ли он новые слова? Почему наши словари такие тонкие? На эти вопросы "РГ" отвечает один из авторов Большого академического словаря русского языка - знаменитого БАСа Людмила Кругликова.

Как считают словарный запас? Почему Оксфордский словарь такой толстый?

Людмила Кругликова: Лингвисты избегают такого рода сравнений между языками и словарями. У каждого своя специфика. Скажем, в Вебстеровский словарь в качестве самостоятельных статей включаются символы, например, химических элементов: B (бор), Ba (барий), Be (бериллий), Br (бром) и так далее, сокращенные наименования мер длины, веса, объема: km (километр), kg (килограмм), bbl (баррель)... Мало того, толковые словари английского языка начали включать символы обозначений размеров листов бумаги: А3, А4, А5, а также, например, символ @.

Поэтому вывод о бедности русского языка и богатстве английского на том основании, что Большой академический словарь русского языка (БАС), который начал выходить в 2004 году (опубликовано 22 тома из предполагаемых 33), будет содержать 150 000 слов, а Оксфордский (Тhe Oxford English Dictionary, сокращенно OED) - 600 000, не что иное, как обман. БАС отражает лексику только современного литературного языка, а Оксфордский словарь - слова всех разновидностей и всех вариантов (американского, канадского и т.д.) английского языка начиная с 1150 года, включая мертвые.

А сколько слов в русском языке, если считать по-английски?

Людмила Кругликова: Если мы добавим к 150 000 слов современного русского литературного языка, например, еще и диалектные слова, то получим уже 400 000 слов...

Как объяснить тот факт, что один из самых известных английских словарей Вебстеровский стал резко худеть, и время "похудения" пришлось на Вторую мировую войну и начало "холодной"?

Людмила Кругликова: Не стоит искать в лингвистических процессах какую-то политику. Вебстеровский словарь, появившийся в 1909 году, содержал 400 000 английских слов. В его втором издании (1934 год) содержится 600 000 слов, в третьем (1961 год) - 450 000 слов. На основании этого можно заявить, что с 1934 года началось катастрофическое вырождение английского языка. А причина таких резких скачков всего лишь в том, что у второго и третьего изданий были разные редакторы, а у них разные принципы подхода к отбору слов.

На сайте издательской фирмы Merriam-Webster сказано: "Считается, что словарь английского языка включает примерно миллион слов". Это честная цифра?

Людмила Кругликова: Большинство лингвистов восприняло такую оценку с долей юмора, а некоторые сказали, что они не были бы удивлены, если бы он оценивался в четверть миллиона.

Откуда тогда взялся миллион?

Людмила Кругликова: Начиная с 2006 года некто Дж. Дж. Паяк, специалист по маркетингу и аналитике, основатель компании Global Language Monitor неоднократно заявлял о том, что скоро будет зафиксировано миллионное слово английского языка. Таким словом стало, по версии Паяка, "Web 2.0", которое является техническим термином. Кстати, уже есть и Web 3.0, а в Сети идет речь о скором появлении Web 4.0, Web 5.0. Если включать все подобные образования, то скоро можно будет говорить о миллиардном слове английского языка.

Как англичане и американцы относятся к таким сенсациям?

Людмила Кругликова: Приведу высказывание Нунберга, лингвиста из Школы информации в Калифорнийском университете в Беркли: "Наше восхищение необъятностью английского языка возникает из своего рода лингвистического империализма - ощущения, что "наши словари больше, чем их словари". Но это на самом деле не делает нас сколь-либо богаче лингвистически".

Но и среди исследователей "великого и могучего" есть лингвистические пессимисты, которые считают, что корни русского языка "бесплодны": не рождают новых слов, а большинство неологизмов имеет иностранное происхождение...

Людмила Кругликова: Лингвист и философ Михаил Эпштейн утверждает, что в XIX веке было 150 слов с корнем "люб", а наши современники знают в три раза меньше. Между тем в "Словообразовательном словаре русского языка" Тихонова, насчитывающем около 145 000 слов современного русского литературного языка, имеется 310 слов с корнем "люб". А если считать начиная с первых памятников письменности, то получится 441 слово. В английском языке, по данным OED, только 108 лексем с аналогичным корнем (love) в начале слова.

Новые слова "про любовь" современные россияне производят?

Людмила Кругликова: В начале ХХ века появилось существительное "книголюб", а затем "природолюб", "однолюбка", "любовь-игра", "любовь-ненависть", "любовь-морковь", "безлюбье". При беглом просмотре я насчитала не менее 40 слов с корнем "люб", которые появились в XX - начале XXI века. В английском языке с корнем (love) только пять единиц вошло в язык в ХХ веке (с 1907 по 1989 год), а после этого времени ни одной.

Насколько активны сейчас наши соотечественники в политическом словотворчестве?

Людмила Кругликова: В этом отношении весьма интересно читать комментарии в Интернете. События на Украине вызвали к жизни такие лексемы, как майдауны, майданутые, онижедети, укры, укропы, псакинг, Фашингтон, Гейропа и другие. Приживутся они или нет, покажет время.

Наши депутаты периодически восстают против заимствований. Где их критический предел в языке? 70% - катастрофично?

Людмила Кругликова: По подсчетам лингвистов, во втором издании Вебстеровского словаря только 35% исконных английских слов, остальные 65% - заимствования. Но пока ничего катастрофического не случилось. Русский язык действительно испытывает большое влияние английского. Но обогащение его англицизмами наблюдается прежде всего в сфере необщенародной лексики, среди которой преобладают термины из области спорта, компьютерного дела, экономики, финансов. Плохо, если они начинают влиять на структуру языка. С русским этого не происходит. Иноязычные слова подстраиваются под систему, заимствованные корни обрастают русскими аффиксами, например: постить, смайлик, океюшки, лайкать и даже облайканный.

За 10 лет работы над БАСом сделано 22 тома - это две трети работы. Вас не упрекают за медлительность?

Людмила Кругликова: Над БАСом работают 5 штатных лингвистов, 3 совместителя и несколько сотрудников издательства. В год выходит в среднем по два тома. Над Оксфордским словарем работают 78 лингвистов, 46 внештатных сотрудников, а также 200 консультантов, штат программистов, маркетологов. Когда в нью-йоркском офисе Оксфордского словаря узнали о наших темпах работы мизерными силами, то план работы их сотрудников увеличили, а главного редактора отправили на пенсию.