LeadPro

Тел: +7 (921) 932-5882
E-mail: info@leadpro.ru

 
 

О компании

Лаборатория Интернет маркетинга ЛидПРО основана в 2009 году в Санкт-Петербурге группой специалистов в области Интернет маркетинга.

Миссия ЛидПРО – привлекать покупателей на сайты своих клиентов.

 
 
 
 
 
 

Яндекс купил синтаксический анализатор

E-mail Печать PDF

29 января 2010 года компания Cognitive Technologies сообщила в своем пресс-релизе о том, что продала компании Яндекс синтаксический анализатор.

Синтаксический анализатор позволяет определить, какими синтаксическими отношениями связаны слова предложения. Это может звучать неожиданно, но для понимания текста эта информация гораздо важнее, чем значение отдельных слов. Потеря знаков препинания в классической фразе «казнить нельзя помиловать» приводит именно к потере однозначности синтаксических связей.

Использование синтаксического анализатора для больших корпусов текста позволяет определять и изучать статистические закономерности языка (встречаемость слов и конструкций). Такого рода закономерности могут быть использованы, в частности, при разрешении неоднозначностей (например «ключ упал на пол» и «в камнях забил ключ»), возникающих во время синтаксического разбора, а также при построении статистических моделей языка для распознавания слитной речи. Стоит отметить, что возможность разрешения неоднозначностей является одной из важнейших характеристик, отличающих лингвистические технологии разработанные Cognitive Technologies.

Применение синтаксического анализатора также позволяет проводить сравнение текстов на основе встречаемости в них различных слов и конструкций и разрабатывать методы понимания текстов, извлечения данных из текстов, а также другие приложения.

На основе данного программного комплекса компанией Cognitive Technologies создан ряд интеллектуальных программных продуктов, например системы определения авторства и стиля документа.

Cообщает Cognitive Technologies

Из этого следует, что в недалеком будущем в поисковом алгоритме Яндекса произойдут изменения, связанные с определением оригинала и стиля текста.