Википедии на искусственных языках

aace3c029b990b28fb4ae40620d37719

Разделы википедии есть на 355 языках (плюс несколько десятков в инкубаторе).

Есть крупные разделы с более чем миллионом статей, их чуть менее 20 (на английском, немецком, русском и так далее; парадоксальным образом на втором месте — википедия на себуанском, одном из языков Филиппин, накачанная ботозаливками).

Есть мелкие, но важные (например, на идише, на африканских языках, или на башкирском).

А есть несколько разделов на искусственных языках. Сейчас их 9 (когда-то был еще один, на токипоне;, но его закрыли очень давно).

Зачем?

Идеология этих разделов такая: зачем писать статьи на сотнях языков, когда можно, объединив усилия, и написать идеальную википедию на одном языке, понятном всем (например, который можно выучить очень быстро). К тому же, он должен быть более нейтральным, чем раздел на языке, который ассоциируется с конкретными странами, как русский или английский.

Разбор разделов

Я попытался разобраться с каждым из этих проектов, в том числе редактировал и создавал статьи на многих из них. Вот немного статистики:

Глубина — один из способов измерить «качество» раздела; чем он больше, тем лучше. Низкие значения часто говорят о том, что статьи пишут боты, и их никто никогда не правит.

Эсперанто

Единственный раздел, который действительно является энциклопедия.

В нем больше 350 тысяч статей и сотни активных (более-менее) редакторов. Статьи разного качества, но в том числе довольно качественные.

Эсперанто — единственный успешный искусственный язык, с двумя миллионами носителей и довольно богатой культурой и историей, литературой и регулярными конгрессами.

Википедия довольно активна, и, поскольку язык не принадлежит какой-либо нации, довольно нейтральна в некоторых темах.

Тем не менее, в отличие от более зрелых разделов, многие статьи вообще не имеют источников, и критерии значимости сильно отличаются от «русской» или «английской». Эсперанто — единственный язык из списка, которым можно пользоваться как энциклопедией.

Другие Эсперантиды и похожие на них

Эсперанто был разработан доктором Заменгофом в 1887 году, и завоевал существенную популярность. С тех пор многие пытались повторить его успех, либо улучшив эсперанто, либо придумав новый язык.

Стали появляться различные «эсперантиды»:

Все эти языки имеют много общего:

Словарный запас, понятный европейцу (в первую очередь — говорящему на романских и германских языках), сравнительно простая грамматика, и уверенность в том, что этот язык лучше, чем эсперанто. 

Идо

Википедия на идо более-менее живая, хотя по-настоящему активных участников там около трех человек (формально — 46 человек). Открыта в 2004 году, на сегодня в ней 46 тысяч статей.

Язык идо — реформированный эсперанто, практически является его диалектом (любой эсперантист довольно легко на нем читает). Язык откололся от эсперанто в 1907 году, вызвал скандалы и расколы, и был благополучно практически забыт, пока лингвонерды и интернет не решили его воскресить, и даже написать на нем википедию. Зачем — не понятно.

Интерлингва

Идея этого языка — подобрать слова, которые есть во всех (или почти во всех) языках. Если вы знаете, например, испанский (даже на плохом уровне) и английский, можете попробовать прочитать статьи, и вы поймете, что вы этот язык понимаете. Качество и количество статей — чуть хуже, чем на идо. Этот язык не является вариацией эсперанто.

Существует еще один язык с таким же названием, когда-то претендовавшим на статус универсального языка — по сути «латынь без словоизменений» (Latina sine flexione). На нем, к счастью, википедию не пишут.

Интерлингве

Он же «Окциденталь». Ещё один форк эсперанто. Раздел начали писать в 2004 году, и написали на нем 12 000 статей, в основном низкого качества. Проект еще более мертвый, чем предыдущие. Более того, почти все мои правки почему‑то воспринимались фильтрами как вандальные.

Из зверей — только две статьи — про черепаху и какапо.

Новиаль

Новиаль — форк идо (форк от форка эсперанто) 1928 года, умер в послевоенные годы после смерти создателя. Зачем‑то возродили его в 1990-е, и зачем-то в 2004 году создали раздел википедии на нем… Еще один полумертвый проект на полумертвом языке. Хотя «глубина» (некий параметр качества) у этого проекта очень высокий (126), содержание — дерьмо; нампример, статей про животных нет совсем, статьи про отряды млекопитающих — есть, но пустые. Совсем пустые, есть только автоматически заполняемый инфобокс (пример). Статьи написаны с ошибками одним-двумя пользователями. Единственный зверь, про который есть статья — ихневмо́н, он удостоился двух предложений…

Lingua Franca Nova

Lingua Franca Nova, ласково называемая elefen — некая попытка возродить реально существовавший язык средиземноморский Lingua Franca, на котором в течение столетий общались моряки всех стран средиземноморья. 

Этот раздел зачем-то открыли в 2018 году, сравнительно недавно. Сообщество мне показалось довольно дружелюбным и чуть более живым, чем 3 предыдущих. Статей — 4200, и среднее качество статей — довольно высокое.

Волапюк

Волапюк — язык, созданный католическим священником еще до эсперанто, и первый язык который претендовал стать универсальным мировым языком (само слово Volapük переводится «мировой язык»).

  • Итак, это первый (с оговорками) универсальный язык

  • Второй созданный в википедии раздел на искусственном языке (2003 год)

  • Третий по количеству статей раздел на конланге (когда-то даже был вторым, благодаря автоматическим заливкам статей).

Сегодня это практически проект одного человека (который почти не знает языка), который каждый день туда что-то пишет (например, создает микростатьи в пару строк про населенные пункты разных стран). Считается, что в мире есть еще несколько человек, способных понимать волапюк. 

Ложбан

Ложбан — это вторая версия языка логлан. Это довольно интересный проект языка, со сложной, но логичной структурой, которая скорее подходит для ИИ, чем для людей. Но все-таки некоторые люди смогли его освоить. На википедии совместными усилиями они написали 1333 статьи, основном низкого качества. Раздел абсолютно мертвый.

Котава

Наиболее мутный проект. Открылся в 2020 году (один из последних разделов). Статей мало, плохого качества; активных людей мало. Позиционирует себя как самый нейтральный, и не основанный на европейских языках. Разобраться с ним по-настоящему у меня не получилось. Этот раздел — почти рекордсмен по количеству статей на носителя языка (0,0024 носителя на статью; это второе место после волапюка, где этот параметр равен 0,0008; для сравнения — в русском или английском — около 80, а эсперанто — 5,6).

Не совсем искусственные языки

С натяжкой очень многие языки можно назвать искусственными, например норвежские или иврит.

А еще есть довольно интересный проект — Simple English. Идея довольно интуитивна: язык, который в реальном мире лингва франка — это английский. Но читать на английском многим сложно — например, из-за слишком большого лексикона. Simple English — попытка переписать энциклопедию так, чтобы ее мог читать даже ребенок или человек, знающий английский на среднем уровне. Для этого там пытаются писать простыми предложениями и ограниченным словарным запасом. В этом разделе — 250 тысяч статей и статеек, раздел довольно живой. Тем не менее, я пока не встречал никого, кто им бы пользовался.

Конланги, на которых википедий нет

Артланги

Дотракийский, На'ви, всевозможные толкинутые языки, так называемые артланги — созданные для книг или фильмов языки бывают довольно интересными, и, на удивление, их знает не так уж мало поклонников. Тем не менее, википедий на них нет. И слава богу.

В 2004 году была википедия на клингонском; ее перенесли сюда: https://klingon.fandom.com/wiki/ghItlh%27a%27.

Токипона

Токи пона — на мой вкус самый удачный проект сконструированного языка. Минималистичный, элегантный и концептуальный, он совершенно не подходит для написания энциклопедии. Тем не менее, она когда-то была. Потом ее закрыли, или, точнее, перенесли на другой домен. А недавно вновь подали заявку, хотят вернуться.

Ифкуиль

Очень интересный проект «идеального» языка.

Во многих случаях, искусственный язык не знает никто, кроме его создателя. В этом случае это не правда — этот язык (прошедший уже несколько ревизий) не знает вообще никто.
Раздела википедии на нем нет.

Междуславянский

Межславянский, междуславянский, панславянский — это мнгочисленные попыки создать язык, понятный любому носителю славянского языка. Последний стандарт получился неплохим. Википедии на нем (пока) нет.

«Сибирский»

Примерно год просуществовал довольно веселый проект под названием Сибирская Википедия. Некий томич по имени Ярослав Золотарёв убедил Wikimedia Foundation, что сибирские говоры настолько отличаются от стандартного русского, что сибирякам нужна своя википедия. Проект предназначался для веселого троллинга, а не для энциклопедических целей. Википедию закрыли (перенеся статьи сюда).

Другие «упрощенные» языки

Simple English — единственный проект из этой серии. Всем остальным (предлагались: китайский, немецкий, иврит, латынь и испанский) было отказано. «Простой эсперанто» пока «рассматривается», но у него нет шансов; один из аргументов — идо это и есть упрощенный эсперанто. 

Примеры текста

Если интересно как выглядят эти языки и насколько они понятны, вот несколько примеров.

Язык

Пример текста

Примечания

Esperanto

Esperanta Vikipedio estas projekto de kunlabora enciklopedio, universala kaj plurlingva, kreita interrete laŭ la vikio-principo. Ĝi celas liveri en Esperanto liberan, objektivan kaj kontroleblan enhavon, kiun ĉiuj povas redakti.

Эсперанто — единственный искусственный язык со зрелым (более-менее) разделом википедии.

Ido

Wikipedia od Wikipedio per l’idala formo, esas grandega projeto por konstruktar kompleta enciklopedio libera ed gratuita. La granda enciklopedii kustumale kustas granda quanteso de pekunio ed olua kontenaji jeresas da l’editanta kompanii.

Идо довольно понятен носителям эсперанто.

Novial

Wikipedie es multilingual, interretal, liberi ensiklopedie projete. Wikipedie bli skripte da volunteres e artikles pove bli skripte e redakte da irgi persone kel have interretal konektione. Lun chefi servere es in Virginia, kun altri serveres in Amsterdam e Seoul.

Тоже очень похож. Информация, как видите, устарела.

Interlingua

Wikipedia es un encyclopedia in linea scripte e mantenite per un communitate de voluntarios, cognoscite como wikipedistas, a traverso del collaboration aperte e utilisante un systema de edition basate in wiki nomine MediaWiki. Wikipedia es le obra de refentia plus grande e plus legite del historia, e ha essite systematicamente un del 10 sitos de rete plus populares. Create per Jimmy Wales e Larry Sanger le 15 de januario de 2001, esse allogiate in le Fundation Wikimedia, un organization statounitese sin scopo lucrative.

Даже не знаю, что добавить: еще одна попытка, похожая на предыдущие.

Interlingue
(Occidental)

Wikipedia es un projecte por li creation de un internet lexico in pluri lingues. Li notion Wikipedia es format ex li havayan parol «Wiki» por «rapid» e li anglesi parol «Encyclopedia» (anglesi por enciclopedie).

Li Wikipedia es scrit per mult voluntarios sur li tot munde. Chascun posse alterar li articules.

Лексика языка основана на словах, заимствованных из европейских языков; статьи на оксидентале можно читать сравнительно легко, даже если вы никогда его не изучали (еще легче, чем на остальных в этом списке)

Lingua Franca Nova

La Vicipedia en lingua franca nova es la varia de Vicipedia scriveda en elefen. La contribui un de esta Vicipedia ia es fada en 16 janero 2017 e la Vicipedia, pos es aprobada en 22 desembre 2017, ia es moveda a sua adirije ueb final en 18 april 2018.

Очень похож на предыдущие, но более аналитический: пытаясь подражать креольским языкам, тут меньше флексий: слова почти не изменяются, зато много служебных словечек, и более важен порядок слов

Kotava

Kotava tir pelafa vegedunafa walvedeyava, reduyuna gan Staren Fetcey bak 1978.

Redura va Kotava va underapa daner, i va undera sopuna mali 1975 gan Staren Fetcey zegapayas va rieta icde gwafa walvedeyafa golerava mu amidaf saneeem ke Tawava. In va gedrafa yovara batdume jupayana isu azed jontikedje vayayar nume di zolteyer da maltcinera deana gan ava dum Esperantoava ok Idoava en tir axoda. Fetcey va sinafa taltekafa staava kerektayar, tulon indon gu ravlemeem, nume va kotrafa is tanuskafa ava envayar.

Тут ничего не понятно.

Lojban

ko’a goi la .uikipedi’as. nondi’a ke sorbau facycku si’u lo nonpalkagni po’u la’o .gy. Wikimedia Foundation .gy. .i ro prenu .e do ka’e bixygau so’a spisu be ko’a le dramau .i ko’a paremei megdo lo ckupau .i ku’i lo ni je li’i jbobau ckupau cu mectce

Знаки типа «точки» в ложбане — это не пунктуация. Роль разделителей предложений, вопросов и так далее выполняют специальные слова.

Volapük

Volapük perevidöl, ü Volapük nulik, jenöfo no pük nesekidik, ab fom nulik Volapüka, pos revid hiela Arie de Jong, äfiniköl ün 1929, päpüböl in Gramat Volapüka ed in el Wörterbuch der Weltsprache fa el de Jong ün 1931, e calöfiko päzepöl fa cifal Albert Sleumer me büad omik de 1934, yanul 1. Volapük perevidöl laibinon jünu fom calöfik püka at.

Язык обычно вызывает желание поржать над ним.

Klingon

wIqIpe’DIya (DIvI' Hol: Wikipedia; «nom» mughlu’bogh wikiwiki Hawai Hol mu’vo' 'ej «Sovpaq» mughlu’bogh encyclopedia DIvI' Hol mu’vo') ghItlh 'oH ghItlhvam’e' DalaDbogh. «qawHaq tlhab» wIqIpe’DIya ponglu', 'InternetDaq Daq 'oHmo', 'oHDaq ghItlhmey ghItlhlaH Hoch 'ej choHlaH. vaj De' Hal’a' chenmoHlu'.

Фанатам  Star Trek тут все понятно.

Simple English

The Simple English Wikipedia is a free encyclopedia for people who are learning English. The Simple English Wikipedia’s articles can be used to help with school homework or just for the fun of learning about new ideas. Non-English Wikipedias can also translate from the articles here.

Английский. Очень простой английский.

Меж-
славянский язык

(Interslavic)

Словјанске језыкы сут односитељно свезана група језыков. Знанје једного словјанского језыка често јест достаточно, да бы имєло се принајмење сурову идеју, о чем јест текст в другом словјанском језыку. Чрєз вєкы, тој факт был дља језыкознавцев и иных надохњенје до будованја универсалного словјанского језыка, разумливого всим Словјанам. Срєд њих јест славны црковнословјанскы језык из 9. столєтја, како и многе ине пројекты од 16. столєтја до днес. Все те пројекты имајут једну обчу характеристику: оне сут базоване на прєдположенју, же словјанске језыкы сут собє на толико подобне, же изтворјенје такого језыка јест можно.

Введение из официального сайта. Все понятно. Википедии на этом языке нет. Кстати, na MEDŽUSLOVJANSKOM možno pisati latinicej.

Сибирская Википедия 

Лександор Пушкин (росс. Александр Сергеевич Пушкин) 1799—1837) — россейской вершун, баюн, шшытатса обосновальником нонешнево руссково краснословвя. Самоголовной евонной вершышше кличетса «Евгений Вонегин», де бают про руссково барина, которому нехрен чем заделатса, мужыки заместо во робют дык, а вон токо путатса с розными бабами.

В некоторых евонных вершах Пушкин потреблят и полношнорусски словы, каки вошедши и в сибирской говор.

Из Пушкина столмачено на сибирской делянки с Евгения Вонегина и верш «Я вас дружыл»

Пушкин дык никода чо-то не был в Сибире-той, ан писал в Сибирь весточку декабристам.

Вот за такие статьи раздел и закрыли (насколько я помню, конкретно за эту статью)

Toki Pona

lipu «Wikipedia» anu lipu Wikipesija li ilo li lipu sona suli. ona li open lon tenpo sike nanpa 2001.

ona la jan mute li ken pana e lipu sona pi ijo ale. nasin ona la jan ale li ken pali e lipu li ken ante e lipu. ni li nasin Wiki. ona li lipu ante pi nasin Wiki. jan mute pi ma ale li kepeken lipu Wikipesija.

Токипонскую википедию тоже закрыли (перенесли в другое место). В дословном переводе это звучит примерно так:
«Страница Википедия — страница знаний большой [сайт]. Она открыта в 2001 время-круг [год]. Много людей [любой человек] может сделать страницу на ней. На ней есть способ создать или изменить [любую] страницу. Этот путь [такой метод] называется Wiki. Есть много страниц технологии Wiki. Многие люди многих стран могут пользоваться википедией.» 

Выводы

Напоследок, вот еще одна табличка, которая подытоживает мое мнение об этих разделах.

Язык

Плюсы

Минусы

Esperanto

Можно пользоваться как энциклопедией. Во многих аспектах более нейтральный раздел, чем любой из «национальных». В списке разделов по качеству статей из выборки тысячи наиболее важных занимает довольно высокое место.

Довольно много плохих статей. Писать без источников не считается зазорным (особенно если статья переводная). Еще там, как мне показалось, не любят использовать викиданные даже там, где вроде стоит.

Ido

Если по-каким то причинам вас бесит эсперантистская тусовка, но эсперанто вы уже знаете, то добро пожаловать сюда, в наиболее живой из всех мертвых разделов википедии. Довольно живое сообщество.

Не сосвсем понятно, для кого вся эта суета: в мире нет людей, которые знают Идо, но не знают Эсперанто.

Novial

Если у вас есть мечта быть администратором википедии, но выучите Новиаль, и вуаля. Все-таки дослужиться до администратора в русскоязычном или английском разделе простому смертному почти недоступно, а тут конкуренции нет.

Мертвый раздел мертворожденного языка

Interlingua

Можете написать статью про свой город, например. OОдин из самых легко читаемых разделов.

Мертвый раздел мертвого языка. Раздел Actualitates не обновляется много лет.

Interlingue
(Occidental)

Можете почитать случайную статью и поэкспериментировать, сколько поймете.

Мертвый раздел мертвого языка, в котором почему-то антиспаммерские фильтры настроены особенно жестко. Есть откровенный мусор. 

Lingua Franca Nova

Довольно вежливое сообщество.

Мертвый раздел мертворожденного языка

Kotava

Можете написать какую-нибудь абракадабру, может, никто не заметит. Нравится почему-то французам. Это один из самых новых разделов. 

Язык разработали с целью быть менее «европеецентричным», чем все эти вариации эсперанто.
Придумали это, естественно, европейцы. И никому, кроме  них самих, он не нужен.

Lojban

Язык по-своему изящен. Если вы компьютер, то он вам должен особенно понравится. Если вы смогли его выучить и написать пару статей, то вы попали в очень элитную и ограниченную тусовку лингвонердов. 

Статей мало, не самого высокого качества

Volapük

Первый универсальный язык (кстати, менее отвратительный, чем кажется с наале). Тут довольно много статей. Если вы программист, можете оттачивать тут своих ботов.

Никому это, разумеется, не нужно. Статьи написаны компьютером, и никто никогда их не читал.

Simple English

Очень логичная идея, писать энциклопедию простым языком. Но не вымышленным, а настоящим.

Я пока не встречало никого, кто бы реально этим пользовался

Меж-
славянский язык

(Interslavic)

Было бы очень мило содержать всего один раздел, понятный любому славяноязычному человеку.

Раздела (пока) нет. Одна из проблем — есть несколько разных вариантов языка, на разных этапах разработки

Сибирская Википедия 

Это смешно.

Никому не нужно

Toki Pona

Это весело. 

Это самый простой язык, когда-либо придуманный. Так что потенциально это самая понятная энциклопедия. Заявка на переоткрытие раздела рассматривается.

Токипона, при всем уважении, не предназначена для энциклопедии. У языка другие цели, с которыми он неплохо справляется.

Очень возможно, что лет через десять-двадцать вся эта возня с языковыми разделами будет совершенно лишней, и будет решаться автоматическим переводом или еще каким-нибудь ChatGPT. Мы последнее поколение, которое пишет энциклопедию вручную, так что ловите момент!  

© Habrahabr.ru