?

Log in

о том, как ищут - Поклонник деепричастий [entries|archive|friends|userinfo]
Anatoly Vorobey

[ website | Website ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Links
[Links:| English-language weblog ]

о том, как ищут [июн. 26, 2007|03:30 pm]
Anatoly Vorobey
[Tags|, ]

Dare Obasanjo пишет о выступлении Мариссы Мейер (Google Search VP) на конференции, посвященной scalability. Из интересного:
Примеры запросов новичка и опытного юзера:

Запрос новичка: Why doesn't anyone carry an umbrella in Seattle?
Запрос эксперта: weather seattle washington

Запрос новичка: can I hike in the seattle area?
Запрос эксперта: hike seattle area

Новый пользователь Гугла в среднем переходит от уровня новичка к уровню эксперта за один месяц.


Из этого не следует, что не нужно в принципе пытаться лучше понимать запросы на 'естественном языке', но важность такого понимания, видимо, бывает сильно преувеличена.

P.S. Это только одна тема из нескольких, которых касается запись Dare, там еще есть немало интересного.
СсылкаОтветить

Comments:
[User Picture]From: sztanko
2007-06-26 12:47 pm
новояз:)
(Ответить) (Thread)
[User Picture]From: gyraf
2007-06-26 12:54 pm
a chto, eshe est' novichki?
voobshe-to, absolutno vezde v povsednevnoy jyzni est takoe poniatie - REGISTER

In linguistics, a register is a subset of a language used for a particular purpose or in a particular social setting
eto est' vezde! v banke, v bol'nitse, v shkole, na rabote, v restorane... vse tak ili inache jyvut s etim i bystro etomu uchatsia - tak obshestvo samo vybralo, tak pochemu search ne mojet imet' svoy register, vpolne normal'no chto eto sushestvuet!
(Ответить) (Thread)
[User Picture]From: reut
2007-06-26 12:54 pm

кстати о поиске, заметила, что у тебя появились таги.
это хорошо. :) спасибо.
(Ответить) (Thread)
[User Picture]From: avva
2007-06-26 12:58 pm
Буду стараться :)
(Ответить) (Parent) (Thread)
[User Picture]From: larisaka
2007-06-26 12:57 pm
Я не верю этим данным: "Новый пользователь Гугла в среднем переходит от уровня новичка к уровню эксперта за один месяц." Где они берут новых пользователей Гугла? Их нет.
(Ответить) (Thread)
[User Picture]From: avva
2007-06-26 12:59 pm
Удивительное дело, но оказывается, что не все пользуются Гуглом :)
(Ответить) (Parent) (Thread) (Развернуть)
(Удалённый комментарий)
[User Picture]From: dimad
2007-06-26 01:07 pm
Вопрос в том, почему эксперты используют такие запросы. Не потому ли что они знают, что запросы на естественном языке обрабатываются хуже чем эти короткие выжимки? Поменяв подход поска поменяется и подход экспертов
(Ответить) (Thread)
[User Picture]From: yakovis
2007-06-26 02:54 pm
да их и набирать короче
(Ответить) (Parent) (Thread)
[User Picture]From: liveuser
2007-06-26 01:10 pm
Вот только не к "уровню эксперта", а к "использованию ключевых слов" или "понимаю основ работы поисковых систем". От поискового эксперта поболе требуется.

И что такое это "в среднем"? Кто-то за день, кто-то через полгода, кто-то никогда. Если мы знаем, что 10% пользователей и через полгода делают запросы на естественном языке - значит ли это, что важность понимания таких запросов преувеличена? А главное, согласятся ли эти 10% с таким утверждением?
(Ответить) (Thread)
[User Picture]From: lestp
2007-06-26 05:12 pm
достаточно один раз сделать запрос "на естественном языке" чтобы увидеть фразу типа "the words I, in and the were not included in your search"
если человек за месяц не сможет сделать из этого соответствующие выводы, то ему ничего не поможет
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: huko
2007-06-26 01:11 pm
интерестно, а откуда уверенность, что сегодняшний эксперт это вчерашний (месячной давности) новичек :) ? IP, cookies, etc. :) ?
(Ответить) (Thread)
[User Picture]From: gt
2007-06-26 01:13 pm
Если бы ещё умудрённые опытом аналитики гуглов и яндексов вспомнили, что часто необходимо искать по ЧАСТИ слова, было-бы здорово. Да и ещё-бы аналог SOUNDEXa добавили, чтоли.
(Ответить) (Thread)
[User Picture]From: mike67
2007-06-26 01:17 pm
Насколько я понимаю, никто серьезно не проверял, насколько один путь эффективней другого?
Я как-то пытался целиком записывать свои маршруты на кубках Яндекса по поиску. Алгоритма, существенно повышающего вероятность нахождения правильного ответа, похоже, не существует.
Вопрос с зонтиком в Сиэтле некорректен, потому что надо сначала точно сформулировать, что ищут. М.б. запрашивающего интересует погода, а м.б. - традиция сиэттлцев носить плащи-дождевики вместо зонтов. Если погода, то м.б. спрашивающий происходит из региона, где зонты используются в основном от солнца. Мало ли что.
(Ответить) (Thread)
[User Picture]From: liveuser
2007-06-26 01:26 pm
> Алгоритма, существенно повышающего вероятность нахождения правильного ответа, похоже, не существует.

Существует :-)
А осенью проверим, существует ли алгоритм, позволяющий продвинуться еще дальше.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: _moss
2007-06-26 01:57 pm
Запрос новичка: What the f@ck?
Запрос эксперта: Bush Iraq
(Ответить) (Thread)
[User Picture]From: gyraf
2007-06-26 02:12 pm
lol
(Ответить) (Parent) (Thread)
[User Picture]From: romanet
2007-06-26 02:57 pm
пользуюсь обоими методами, скажем, в обьявлениях о поиске работы, выбираю самую сранную фразу и в 90% случаев Google находит оригинальное объявление
(Ответить) (Thread)
(Удалённый комментарий)
[User Picture]From: snyders
2007-06-26 05:18 pm
забавно, что я как раз перешел на запросы на естественном языке в некоторых ситуациях. Например "How to ". Если ищется что-то, на что ответ может лежать на каком-нибудь форуме или блоге помогает представить себе, как другие люди задают этот вопрос или как другие на него отвечают.

Probably memoryless search engines will soon be obsolete. In many cases single query is not enough to describe the question.
(Ответить) (Thread)
From: dmpogo
2007-06-26 09:02 pm
я как раз перешел на запросы на естественном языке в некоторых ситуациях

Exactly, this especially can work better if the answer is expected to come from some message board or mail list. If I have computer question I often search for the form as I would ask it my computer manager, and frequently get exactly the question asked and answered.

(Ответить) (Parent) (Thread) (Развернуть)
From: 999999
2007-06-26 07:45 pm

NL question answering

Its importance for the user may be exaggerrated, but we need it to keep frustrated linguists off the streets and entrepreneurs entertained.
(Ответить) (Thread)
[User Picture]From: cema
2007-06-26 09:22 pm
weather "seattle, wa"

hike "seattle *** area"

Так лучше?
(Ответить) (Thread)
[User Picture]From: avva
2007-06-26 10:33 pm
Not necessarily. Sometimes a more straightforward and naive query will trigger the special weather-specific search result at the top, while a more crafted one will miss it and do only websearch. In this specific case, [weather "seattle, wa"] is still good for that, though.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: bugabuga
2007-06-26 11:59 pm
Я думаю это простая оптимизация. Как студенты быстро учатся конспектировать опуская ненужные слова, так и ищущие выкидывают то, что не изменяет результат. То бишь на клочке бумаги для себя люди пишут "Weather tomorrow?" или "Check forecast" а не "Check what weather will be tomorrow" и "Don't forget to check weather forecast". Я думаю что начинающие юзеры думают что компьютер "глупый и въедливый" и всё надо расписывать до точки. Потом быстро привыкают :)
(Ответить) (Thread)
[User Picture]From: sanmai
2007-07-09 06:55 am
Напоминает разговорный китайский: у них тоже "дорога идти вперед налево" в дословном переводе.
(Ответить) (Thread)