?

Log in

No account? Create an account
Как, читая новости, приносить пользу науке? - Разнопись

> Свежие записи
> Архив
> Друзья
> Личная информация

Links
Lvova@SUL

Пожертвования
Подари жизнь!
AdVITA
Фонд помощи хосписам Вера
Википедия

Отдать ненужные вещи в Питере
Отдать ненужные вещи в Москве

Декабрь 17, 2015


Previous Entry Поделиться Next Entry
01:11 pm - Как, читая новости, приносить пользу науке?
Мой выбор по волонтёрству без общения с людьми-2014.

Originally posted by alt17 at Как, читая новости, приносить пользу науке?

"
В предыдущий раз мы написали на Хабре о краудсорсинге лингвистических данных. Речь шла о морфологической разметке (part of speech tagging) современных текстов на русском языке. С тех пор было размечено около 2.2 млн. заданий, и около 3 тысяч человек приняли в этом участие. Мы с вами прошли чуть больше половины пути. Спасибо, что вы помогаете нам!

В OpenCorpora мы создаём открытые данные для обучения и тестирования математических моделей анализа текста на русском языке. Таким образом, мы помогаем российской компьютерной лингвистике догнать западную. Потом будем помогать обгонять ;)

Сегодня мы расскажем о разметке именованных сущностей. Это ещё один слой разметки текстов в Открытом корпусе. Мы будем выделять в тексте имена людей, названия компаний и географических объектов ...
"
http://geektimes.ru/post/267774/
 

( 4 улыбнулись :) smile2me )

Comments:


From:ixtiandra
Date:Декабрь 17, 2015 10:41 pm
(Link)
Остаётся непонятным, отчего "российской компьютерной лингвистике" запрещено платить за корпус русского языка и почему она вынуждена пользоваться халявным.
[User Picture]
From:lvova
Date:Декабрь 17, 2015 11:02 pm
(Link)
Я, как обычно, не понимаю, имеет ли смысл отвечать на этот вопрос - из года в год не меняется впечатление, что за подобными вопросами не стоит искреннего интереса к затронутой теме, а лишь какая-то идущая на своей волне идея. Но ок, попробуем снова, хотя я и была бы куда более рада, если бы столь постоянный собеседник постарался бы однажды стать собеседником интересным.
Вот, например: проекты с открытым кодом, разрабатываемые открытыми коллективами, хороши возможностью многократной перепроверки, причем любая перепроверка может быть воспроизведена в любой момент. При многообразии лицензий, позволяющих работать с такой открытостью, была выбрана та, которая, среди прочего, позволяет легко набрать большую базу современных текстов. При желании за пользование всеми продуктами, связанными с ней, можно платить - временем, донатом, просто при коммерческом использовании; ведь отсутствие интереса в вопросе палит уже слово "халявный" при том, что ни продукт, ни его компоненты не связаны с ограничением Non-commercial.
Организаторы корпуса описывали свои мотивы в том числе в часто задаваемых вопросах на сайте, кстати; но даже без их подсказок можно вспомнить, например, о такой группе, которой пригодится бесплатный доступ к корпусу, как студенты.
И в конце концов, идите, купите себе уже что-нибудь. Я, кстати, цифровой контент покупаю, наверное, даже чаще раза в неделю. Можете покупать себе что-нибудь строго платное каждый раз, когда Вы вновь задумаетесь о том, зачем же кто-то в очередной раз работает над чем-то лицензионно свободным. Ваш выбор, пользоваться бесплатным никто не заставляет.
From:ixtiandra
Date:Декабрь 17, 2015 11:49 pm
(Link)
Проекты с открытым кодом не могут работать за пределами открытого кода. Поэтому свободные лицензии не пользуются успехом ни у фотографов (как показал живой журнал), ни у писателей (как показывает самиздат), ни у кинематографистов и музыкантов (как показывает Михалков), ни у художников (как показывает Союз художников). Даже у архитекторов это не пользуется успехом, как показала статья в отраслевом журнале (metragi.ru/arxiv-vyipuskov/2015/02/avtorskie-znaki.html).

База современных текстов уже собрана -- есть Национальный корпус www.ruscorpora.ru. Он полностью обеспечивает все нужды корпораций. Студентам он вполне доступен.

Слово "халявный" означает, что клиенты Открытого корпуса не желают платить, а хотят получать его за просто так.
[User Picture]
From:lvova
Date:Декабрь 18, 2015 08:39 am
(Link)
"Проекты с открытым кодом не могут работать за пределами открытого кода." - зависит от лицензии.
"Поэтому свободные лицензии не пользуются успехом ни у фотографов (как показал" - теперь я буду знать, что такое успех.


> Go to Top
LiveJournal.com