Прежде всего, что считать словом? Мы привыкли, что слово — это совокупность букв между двумя пробелами. Но в языке гренландских эскимосов отдельные слова просто отсутствуют и каждое предложение можно считать отдельным словом. Да и в менее экзотических языках есть проблемы. Например, в чешском языке «не» с глаголами пишется слитно, в турецком отрицание вообще запрятано в центре слова, так что по нашим правилам каждое слово с отрицанием нужно считать отдельно.
И как в таком случае быть с окончаниями (большой, большая, большое) и омонимами (лук как растение и лук как оружие)? Можно ли считать отдельными словами сложносокращенные слова и аббревиатуры? Можно ли засчитать слово «кавеэнщик» или «замполит»? А пресловутое «замолаживать»? И в каждом языке таких подвохов десятки тысяч!
Еще более каверзные вопросы возникают по поводу того, что считать языком? Считать ли диалекты и говоры как отдельные языки или разновидности основного? Кстати, в Европе и Африке частенько случается, что и не сразу определишь, какой язык для диалекта является основным, до того все перепутано.
А можно ли однозначно определить, к какому языку относится то или иное слово? Например, «хата» или «атаман» — это русские или украинские слова? Какому языку засчитывать слова «сервер», «сайт», «провайдер» — английскому, немецкому, русскому или всем сразу?
Поэтому ограничимся лишь отдельными прикидками, которые ни в коей мере не претендуют на какую-либо научную ценность, но может быть, окажутся познавательными.
Начнем, конечно же, с русского языка.
- Лингвисты утверждают, что в нем около 500000 слов, не считая специальных и научных терминов, которые удваивают это число.
Конечно, среди этого невообразимого множества есть устаревшие, заимствованные и сложные слова, имеющие в своём составе не менее двух полнозначных основ, уменьшительные, ласкательные и прочие формы одного и того же исходного слова. Поэтому если же обратиться к самому авторитетному Большому академическому словарю в 17 томах, то окажется что в нем 131 257 слов. Но следует учесть, что вышел этот словарь в 1970 году и ничего не знает про перестройку, Интернет и прочие радости современной жизни, а также про бытующие в сельской местности диалектные слова и
Что касается английского языка, то по данным проекта Global Language Monitor, в середине 2009 года количество слов в нем превысило один миллион и продолжает расти со скоростью около 15 слов в день. Верить этому или нет — решайте сами, но миллионным стало слово «Web 2.0». Да-да, именно так — с циферками!
Кроме того, среди зарегистрированных в этом списке слов можно найти 9/11, Obama, Vladimir Putin, H1N1, dot.com, Y2K, King of Pop, Same-sex marriage, Ho-Ho-Ho (традиционная фраза Санта Клауса) и даже =^.^= (котенок) и прочие смайлики! Интересно, что получится, если по таким же правилам учесть в русском языке все Фортинбрасы на Умслопогасе и РУ СК ГП МВД РФ?
Но и по словарям английский язык выигрывает вчистую.
- Так, в третьем издании Вебстеровского словаря 450 тысяч слов, а в полном Оксфордском — около 500 тысяч.
Особняком стоят иероглифические языки, где каждый символ означает не букву, а целое слово. Здесь прямые сравнения и вовсе невозможны. Если же смотреть по словарям, то такие языки сильно проигрывают.
- Наиболее полный японский словарь содержит 50000 иероглифов.
При этом министерство просвещения Японии определило для повседневного использования только 1850 иероглифов.
- В китайском языке общее количество иероглифов побольше — около 80 тысяч.
Но и здесь реально используется много меньше. Так, принятый в 1981 году государственный стандарт «Основной набор иероглифов, закодированных для использования в ЭВМ» включает 6763 иероглифа.
Однако формальным победителем по словарному запасу является итальянский язык.
- У итальянцев все составные числительные прописью пишутся слитно, в одно слово. А так как ряд чисел бесконечен, то бесконечно и количество слов итальянского языка.
Нокаут!