robogeek.ru

все о роботах и робототехнике

edu.robogeek.ru

все об обучении робототехнике

12.10.2017

Продвинутый поиск Endurance + ParaPhaser + Google

Сколько времени у вас отнимает найти ту или иную информацию, если она распространенная? А если нет — как быть? Новый материал он нашего постоянного автора Георгия Фомичева поможет разобраться.

Если информации много и она хорошо распространена, все можно найти очень быстро благодаря Google. Например, купить «iPhone 8 в Москве» или «купить новый Мерседес GLE». С этой задачей Google поиск справляется идеально. Вы получаете первые 10 ссылок, смотрите, выбираете, покупаете. Эта проблема решена.

Но что, если вам нужно купить «iPhone 7 бу в Москве» или «Мерседес GLK с пробегом»? Здесь уже могут быть нюансы, т.е. где-то нет в наличие, где-то под заказ, где-то просто дорого…

В данном случае вам нужно просмотреть уже 2-3, а то и 5 страниц выдачи поисковика, чтобы выбрать то, что нужно, и это уже не 5-10 минут, а может потребовать час или два.

Мы придумали, как сэкономить ваше время с помощью бота парсера:

Вы пишите запрос, указываете глубину поиска, время поиска и через 10-15 минут находите большое количество сайтов и мэйлов. У вас получается огромное количество мэйлов, по которым вы можете сделать небольшую (не спам) рассылку, задав конкретные вопросы. Например текст письма может быть таким:

«Добрый день! Я ищу iPhont 7 бу в Москве. Есть ли в наличие и сколько стоит? Возможна ли доставка или самовывоз? Спасибо!»

Подобный запрос интернет-магазины могут получать и обрабатывать вручную, но также они могут настроить чатбота, который бы отвечал на подобные запросы автоматически.

Таким образом, вы сможете получить ответ на свой запрос существенно быстрее, причем непосредственно от продавцов и поставщиков.

Это первый шаг перехода к новой эре «интернет людей 1.0», когда люди будут общаться в большинстве своем с чатботами.

Рассмотрим третий сценарий, когда запрос крайне редкий, специфический и содержит много критериев, например, цена, дата, время, наличие и т.д.

Пример такого запроса может быть: «аренда квартиры или апартаментов в Валенсии на короткий срок 800 евро в месяц», или «ремонт ноутбука HP 4520S в Валенсии», или «детский сад для ребенка в пригороде Валенсии Альборайа».

Все эти специфические запросы довольно плохо обрабатываются поисковой системой Google, и проблема не в том, что Google плохо работает, а в том, что Google не понимает, что для вас важно и что является основным, а что вторичным.

Для этого мы используем текстовый процессор ParaPhraser, который призван проанализировать выдачу Google и предложить только те ответы, которые удовлетворяют заданным критериям.

Итак, то, что будет целевым в запросе, мы выделяем:

«ремонт ноутбука HP 4520S в Валенсии». Т.е. если не будет указано на сайте ни одного из этих слов, то выдача Google будет проигнорирована.

Аналогично запросу «детский сад для ребенка в пригороде Валенсии Альборайа».

Это позволит намного больше сузить Google выдачу и полностью исключить нерелевантные запросы.

В настоящий момент реализована функция полного соответствия. В следующей версии будет реализована более продвинутая функция поиска по синонимам, смыслам и т.д.

Попробовать бот парсер можно на нашем сайте.

Если хотите узнать подробнее, пишите gf@EnduranceRobots.com

Или коммуникация через мессенджеры (whatsapp, viber, telegram, wechat): +79162254302

Комментарии

(0) Добавить комментарий

Новые комментарии

Роботы смогут стать частью муравьиной колонии
Гость
11.10.2017
10:36:42
В своем следующем проекте исследователям следует сфокусироваться на повышении качества жизни у тараканов - они (тараканы) намного более близки...
Мой друг – робот. Социокультурные аспекты социальной робототехники
Татьяна
01.10.2017
02:03:46
Отличный курс, очень интересный!