robogeek.ru

все о роботах и робототехнике

edu.robogeek.ru

все об обучении робототехнике

16.06.2017

Лингвистический API (облачный сервис) для разработчиков чатботов и лингвистов

EnduranceRobots.com вместе с ParaPhraser.ru предлагают универсальный лингвистический сервис API для всех: разработчиков чатботов, веб-мастеров, рекламщиков, копирайтеров, лингвистов. Альфа-версия сервиса доступна для всех абсолютно бесплатно (лицензия MIT).

Функции API

Вектор похожих слов (фраз)

Статус: работает

Возвращает список слов или фраз, близких по смыслу исходному слову или фразе, на основе векторной семантической модели.

Описание

Функция принимает на вход фразу или слово, осуществляет морфологический разбор, снимает неоднозначность на уровне частей речи и возвращает список фраз или слов, семантически близких к исходной фразе или слову, на основе технологии Word2Vec. Также возвращаются начальная форма и часть речи исходного слова в формате Universal POS tags (в случае фраз эта информация возвращается для каждого слова внутри исходной фразы).

В случае, если на вход подается слово, которое является неоднозначным, ответ выдается для каждой возможной части речи этого слова отдельно. Кроме того, выдаваемые слова ставятся в ту же форму, что и слова в исходном запросе.

В случае, если на вход подается слово, отсутствующее в векторной модели, функция возвращает только начальную форму и часть речи. Некоторые служебные части речи (артикли, вспомогательные глаголы), а также знаки пунктуации и прочие символы обрабатываются аналогичным образом – функция возвращает только начальную форму и часть речи.

Функция является базовой для данного API.

Параметр Описание
query Искомое слово или фраза (строка, длина не более 90 символов)
top Количество возвращаемых схожих по смыслу слов или фраз (число), не более 30
lang Язык (может принимать значения «ru» или «en»)
format Формат вывода (должен принимать значение «json»)
token Уникальный ключ пользователя

Пример запроса (RU)

http://www.paraphraser.ru/api?c=vector&query=ищите женщину&top=3&lang=ru&format=json&token=485…64

Пример ответа (RU)


{
"code": 0,
"response": {
"1": {
"original": "ищите женщину",
"vector": [
"отыскивайте девушку",
"выискивайте девушку",
"отыскивайте мужчину",
],
"lemma": "искать женщина",
"pos": "VERB NOUN"
}
},
"msg": "OK"
}

Пример запроса (EN)

http://www.paraphraser.ru/api?c=vector&query=rainy day&top=3&lang=en&format=json&token=485…64

Пример ответа (EN)


{
"code": 0,
"response": {
"1": {
"original": "rainy day",
"vector": [
"muggy month",
"windless month",
"windless week",
],
"lemma": "rainy day",
"pos": "ADJ NOUN"
}
},
"msg": "OK"
}

Коэффициенты семантической близости

Статус: работает

Возвращает для каждой фразы или слова в выдаваемом векторе близких слов коэффициент семантической близости между выдаваемым и исходным словом или фразой.

Описание

Функция расширяет вектор похожих слов (фраз), снабжая его коэффициентами семантического сходства (по отношению к исходному слову или фразе). Коэффициенты могут принимать значения от 0 до 1.

Параметры

В дополнение к базовым параметрам функции получения похожих слов (фраз) следует указывать следующие параметры:

Параметр Описание
scores Возвращать коэффициенты семантической близости (число, должно принимать значение «1»)

Пример запроса (RU)

http://www.paraphraser.ru/api?c=vector&query=ищите женщину&top=3&scores=1&lang=ru&format=json&token=485…64

Пример ответа (RU)


{
"code": 0,
"response": {
"1": {
"original": "ищите женщину",
"vector": [
[
"отыскивайте девушку",
0.7048
],
[
"выискивайте девушку",
0.7011
],
[
"отыскивайте мужчину",
0.6609
]
],
"lemma": "искать женщина",
"pos": "VERB NOUN"
}
},
"msg": "OK"
}

Пример запроса (EN)

http://www.paraphraser.ru/api?c=vector&query=rainy day&top=3&scores=1&lang=en&format=json&token=485…64

Пример ответа (EN)


{
"code": 0,
"response": {
"1": {
"original": "rainy day",
"vector": [
[
"muggy month",
0.755
],
[
"windless month",
0.7492
],
[
"windless week",
0.7437
]
],
"lemma": "rainy day",
"pos": "ADJ NOUN"
}
},
"msg": "OK"
}

Примечание

Данная функция может вызываться совместно с функцией словоформ.

Словоформы

Статус: работает

Возвращает все словоформы слов из вектора для заданного слова (фразы).

Описание

Функция расширяет вектор похожих слов (фраз), возвращая все возможные формы исходного слова (или слов внутри исходной фразы), а также все возможные формы слов для результирующего вектора слов/фраз.

Параметры

В дополнение к базовым параметрам функции получения похожих слов (фраз) следует указывать следующие параметры:

Параметр Описание
forms Возвращать все словоформы (число, должно принимать значение «1»)

Пример запроса (RU)

http://www.paraphraser.ru/api?c=vector&query=ищите женщину&top=3&forms=1&lang=ru&format=json&token=485…64

Пример ответа (RU)


{
"code": 0,
"msg": "OK",
"response": {
"1": {
"pos": "VERB NOUN",
"lemma": "искать женщина",
"forms_query": {
"ищите": [
"ищете",
"искало",
"искали",
"ищешь",
"ищем",
"ищут",
"искала",
"ищу",
"ищет",
"искал"
],
"женщину": [
"женщине",
"женщинами",
"женщины",
"женщинах",
"женщинам",
"женщиной",
"женщина",
"женщин",
"женщину"
]
},
"original": "ищите женщину",
"forms": [
{
"отыскивайте": [
"отыскивает",
"отыскивала",
...
],
"девушку": [
"девушка",
"девушки",
...
]
},
{
"выискивайте": [
"выискивает",
"выискиваю",
...
],
"девушку": [
"девушка",
"девушки",
...
]
},
{
"отыскивайте": [
"отыскивает",
"отыскивала",
...
],
"мужчину": [
"мужчина",
"мужчиной",
...
]
}
],
"vector": [
"отыскивайте девушку",
"выискивайте девушку",
"отыскивайте мужчину",
]
}
}
}

Пример запроса (EN)

http://www.paraphraser.ru/api?c=vector&query=rainy day&top=3&forms=1&lang=en&format=json&token=485…64

Пример ответа (EN)


{
"code": 0,
"msg": "OK",
"response": {
"1": {
"pos": "ADJ NOUN",
"lemma": "rainy day",
"forms_query": {
"rainy": [
"rainy",
"rainier",
"rainiest"
],
"day": [
"day",
"days"
]
},
"original": "rainy day",
"forms": [
{
"muggy": [
"muggy",
"muggier",
"muggiest"
],
"month": [
"month",
"months"
]
},
{
"windless": [
"windless"
],
"month": [
"month",
"months"
]
},
{
"windless": [
"windless"
],
"week": [
"week",
"weeks"
]
}
],
"vector": [
"muggy month",
"windless month",
"windless week",
]
}
}
}

Примечание

Данная функция может вызываться совместно с функцией коэффициентов семантической близости.

Словарные синонимы

Статус: работает для русского языка. Дата запуска английской версии – 20.07.2017

Возвращает синонимы к заданному слову (фразе) на основе словаря синонимов.

Описание

Функция возвращает синонимы к исходным слову или фразе на основе синсетов из тезауруса Yet Another RussNet. В случае фразы синонимы подбираются отдельно для каждого слова внутри фразы (кроме служебных частей речи), а затем комбинируются в составе фразы.

Кроме того, для каждого слова внутри фразы функция возвращает начальную форму и часть речи в формате Universal POS tags. Для некоторых служебных частей речи (артикли, вспомогательные глаголы), а также знаков пунктуации и прочих символов синонимы не подбираются – возвращаются только начальная форма и часть речи.

Параметры

Параметр Описание
query Искомое слово или фраза (строка, длина не более 90 символов)
top Максимально допустимое количество возможных комбинаций (число), не более 30
lang Язык (может принимать значения «ru» или «en»)
format Формат вывода (должен принимать значение «json»)
token Уникальный ключ пользователя

Пример запроса (RU)

http://www.paraphraser.ru/api?c=syns&query=кошка смотрит в окно&top=3& lang=ru&format=json&token=485…64

Пример ответа (RU)


{
"code": 0,
"response": {
"1": {
"original": "кошка смотрит в окно",
"syns": [
"киса глядит на окошко",
"мурка глядит на окошко",
"киска глядит на окошко",
],
"lemma": "кошка смотреть в окно",
"pos": "NOUN VERB ADP NOUN"
}
},
"msg": "OK"
}

Пример запроса (EN)

http://www.paraphraser.ru/api?c=syns&query=rainy day&top=3& lang=en&format=json&token=485…64

Пример ответа (EN)


{
 "code": 0,
"response": {
"1": {
"original": "rainy day",
"syns": [
"showery twenty-four hours",
"showery twenty-four hour period",
"showery 24-hour interval",
],
"lemma": "rainy day",
"pos": "ADJ NOUN"
}
},
"msg": "OK"
}

Примечание

Набор входных параметров данной функции может быть расширен для получения коэффициентов семантической близости и словоформ. На данный момент функция реализована только для русского языка.

Определение пропущенной части предложения

Статус: работает для английского языка. Дата запуска русской версии – 20.07.2017

Возвращает значение, указывающее на отсутствие в предложении подлежащего или сказуемого.

Описание

Функция принимает на вход предложение и проверяет, содержит ли оно и субъект (подлежащее), и предикат (сказуемое).

Параметры

Параметр Описание
query Искомое слово или фраза (строка, длина не более 90 символов)
lang Язык (может принимать значения «ru» или «en»)
format Формат вывода (должен принимать значение «json»)
token Уникальный ключ пользователя

Пример запроса (RU)

http://paraphraser.ru/api?c=misent&query=ищите женщину&lang=ru&format=json&token=485…64

Пример ответа (RU)


{
"response": {
"missing": ["subject"],
"phrase": [
{
"word": "ищите",
"pos": "VERB",
"lemma": "искать"
},
{
"word": "женщину",
"pos": "NOUN",
"lemma": "женщина"
}
]
},
"code": 0,
"msg": "OK"
}

Пример запроса (EN)

http://paraphraser.ru/api?c=misent&query=rainy day&lang=en&format=json&token=485…64

Пример ответа (EN)


{
"response": {
"missing": ["predicate"],
"phrase": [
{
"word": "rainy",
"pos": "ADJ",
"lemma": "rainy"
},
{
"word": "day",
"pos": "NOUN",
"lemma": "day"
}
]
},
"code": 0,
"msg": "OK"
}

Функции API, которые полностью находятся в разработке:

Гипонимы и гиперонимы

Статус: тестирование русского и английского языка. Дата запуска – 20.07.2017

Возвращает гипонимы и гиперонимы для слов из запроса.

Описание

Функция возвращает более частные (гипонимы) и более общие (гиперонимы) понятия для слов из запроса (кроме служебных частей речи) на основе данных Викисловаря. Гипонимы и гиперонимы ставятся в ту же форму, что и исходное слово. В случае запроса-фразы функция возвращает гипонимы и гиперонимы к каждому слову из фразы отдельно (кроме служебных частей речи).

Параметры

Параметр Описание
query Искомое слово или фраза (строка, длина не более 90 символов)
top Максимально допустимое количество возможных комбинаций (число), не более 30
lang Язык (может принимать значения «ru» или «en»)
format Формат вывода (должен принимать значение «json»)
token Уникальный ключ пользователя

Пример запроса (RU)

http://www.paraphraser.ru/api?c=hyp&query=ищите женщину&top=3&lang=ru&format=json&token=485…64

Пример ответа (RU)


{
"code": 0,
"response": {
"1": {
"original": "ищите женщину",
"lemma": "искать женщина",
"pos": "VERB NOUN",
"hyponym": {
"ищите": [
"отыскивайте",
"приискивайте",
"разыскивайте",
],
"женщину": [
"старуху",
"мать",
"барышню"
]
},
"hypernym": {
"ищите": [],
"женщину": [
"человека",
"самку",
"любовницу"
]
},
}
},
"msg": "OK"
}

Пример запроса (EN)

http://www.paraphraser.ru/api?c=hyp&query=ищите женщину&top=3&lang=en&format=json&token=485…64

Пример ответа (EN)


{
"code": 0,
"response": {
"1": {
"original": "rainy day",
"lemma": "rainy day",
"pos": "ADJ NOUN",
"hyponym": {
"rainy": [],
"day": [
"date",
"tomorrow",
"yesterday"
]
},
"hypernym": {
"rainy": [],
"day": [
"time unit",
"unit of time",
"time"
]
},
}
},
"msg": "OK"
}

Определение тональности

Статус: тестирование русского и английского языка. Дата запуска – 30.07.2017

Функция возвращает тональность – общее настроение запроса.

Описание

Тональность, или настроение, запроса, классифицируется как позитивная, негативная или нейтральная.

Параметры

Параметр Описание
query Искомое слово или фраза (строка, длина не более 90 символов)
lang Язык (может принимать значения «ru» или «en»)
format Формат вывода (должен принимать значение «json»)
token Уникальный ключ пользователя

Пример запроса (RU)

http://paraphraser.ru/api?c=sentiment&query=ищите женщину&lang=ru&format=json&token=485…64

Пример ответа (RU)


{
"code": 0,
"response": {
"sentiment": "neutral"
},
"msg": "OK"
}

Пример запроса (EN)

http://paraphraser.ru/api?c=sentiment&query=rainy day&lang=en&format=json&token=485…64

Пример ответа (EN)


{
"code": 0,
"response": {
"sentiment": "negative"
},
"msg": "OK"
}

Определение тематики запроса по Википедии

Статус: тестирование русского и английского языка. Дата запуска – 30.07.2017

Возвращает тематику запроса исходя из классификации Википедии.

Описание

Функция классифицирует тематику запроса на основе категорий Википедии.

Параметры

Параметр Описание
query Искомое слово или фраза (строка, длина не более 90 символов)
lang Язык (может принимать значения «ru» или «en»)
format Формат вывода (должен принимать значение «json»)
token Уникальный ключ пользователя

Пример запроса (RU)

http://paraphraser.ru/api?c=wikitopic&query=ищите женщину&lang=ru&format=json&token=485…64

Пример ответа (RU)


{
"code": 0,
"response": {
"topics": [
"Фильмы 1982 года",
"Фильмы Аллы Суриковой",
"Телефильмы СССР 1982 года",
"Фильмы студии «Мосфильм»",
"Кинокомедии СССР",
"Кинокомедии 1982 года",
"Детективные фильмы СССР",
"Фильмы о юристах",
"Экранизации произведений Робера Тома"
]
},
"msg": "OK"
}

Пример запроса (EN)

http://paraphraser.ru/api?c=wikitopic&query=rainy day&lang=en&format=json&token=485…64

Пример ответа (EN)


{
"code": 0,
"response": {
"topics": [
"Jangle pop groups",
"Alternative rock groups from California"
]
},
"msg": "OK"
}

Перефразирование текста

Статус: тестирование русского и английского языка. Дата запуска – 30.08.2017

Перефразирование текста произвольной тематики с указанной долей заменяемых слов.

Описание

Функция принимает на вход произвольный текст объемом не более 5000 символов и возвращает перефразированный текст, где часть слов заменена синонимами в нужной форме слов. Процент заменяемых в тексте слов регулируется пользователем.

Как это выглядит


Кликните для увеличения

Если у Вас есть бизнес потребность в дополнительном инструментарии, напишите нам об этом: gf@EnduranceRobots.com

Если у Вас коммерческий запрос, позвоните нам 8 916 225 4302

Доступ к API открыт по протоколу HTTP (поддерживаются методы POST и GET), кроме того, API можно пользоваться через специальную форму здесь

Описание функций API, инструкции и примеры запросов можно найти здесь

Комментарии

(0) Добавить комментарий

Новые комментарии

В Москве прошел рэп-баттл искусственных интеллектов (+видео)
Гость
08.12.2017
02:01:57
Круто! До чего дошел прогресс))
Rozum Robotics: заметка по минскому хакатону (+ видео)
Гость
05.12.2017
09:21:38
Ребята из Rozum Robotics молодцы! Отличный пример, как может развиваться инновационная компания из постсоветского пространства. И не нужно рассказывать,...