yamadacomma | Shared With: Everyone - Mar 22 2009 | セマンティック, ソーシャル検索
Quoted: 検索分野における現在の二大トレンドはセマンティックとソーシャル検索だ。スタートアップのWorioは、これまで開発してきたセマンティック検索エンジンをFacebook Connect対応とすることで、両者を結びつける試みを発表した。Worioの技術の背景にあるのはセマンティックなタグ付けシステムだ。収集したウェブページの情報を分析し、テキストの意味を自動的に判断してカテゴリ分けを行う。検索時には通常の検索と、タグに基づくディスカバリーフィードの双方を同時に行う。検索結果はリンクライブラリに保存することができる。
Facebook ConnectでWorioにサインインすると、プロフィールの解析が終了すれば、プロフィール情報や、友人が Facebookでシェアしているリンク、およびWorioが本人および友人に対して付加したセマンティックタグの情報が、以降の検索実行時に参照されるようになる。たとえば「レストラン」を検索すると、Worioはこちらがニューヨークに住んでいることを理解して、ディスカバリーフィードには検索条件にニューヨークを指定しなくても、ニューヨークのレストラン情報を提示してくれるようになる。
yamadacomma | Shared With: Everyone - Dec 04 2008 | 動画, セマンティック, 教育, 広告
Quoted: ハウツー・ビデオの5minはこのほどサービスを拡張し、VideoSeedというサイトをローンチした。これは5minのビデオポータルで、同時に他のサイトへのネットワーク配信も行う。VideoSeedはネットワークに参加しているサイトの内容を解析し、セマンティック・マッチングを行って関連あるビデオクリップを選択して送り出す。VideoSeedプラットフォームは、パートナー・サイトからキーワードを抽出して、5minのデータベースでタイトルとタグ情報を検索し、関連あるビデオを選ぶ。(同時に関連ある広告が付加される)。
「大規模なユーザー生成ビデオウェブ上にあふれているビデオクリップの多くはタグ付けされていない。それと異なり、われわれのビデオは内容の品質と品位が確認ずみであり、内容に応じてタグ付けされている。これにより、パートナーのサイトに適切なビデオを配信することが可能になっている」と述べている。
yamadacomma | Shared With: Everyone - Nov 05 2008 | セマンティック, 自然言語処理, リファレンス
Quoted: Linkool Internationalが開発したFirefoxブラウザのサイドバーJuiceが、公開ベータに入った。この強力なプラグインは、ユーザが言葉を検察したり強調表示にすると、関連する情報を自動的に集めてくれる。便利なリファレンスツール(参考資料を集めるツール)なので、一度使うと習慣的に使うようになる。またメディアストレージツールの機能も持っていて、ビデオや画像のファイルをサイドバーへドラッグ&ドロップすると、それらを後で見れるように保存してくれる。
Juiceが情報を探す先は、Wikipedia、Google News、YouTube、CrunchBaseだ。これらからJuiceは、いわば、ユーザがよく知らない言葉に関する“一目で分かる用語解説”のような参考記事を作ってくれる。このサイドバーはとても洗練されていて、インラインビデオの再生や、長〜短2タイプに伸縮できる要約記事も提供する。メディアストレージ機能は、とても使いやすい。
Juiceは北京のLinkool Labsの最初のアプリケーションで、同社の“インテリジェントな発見エンジン”と“自然言語処理”、そして“辞書管理システム”を一体化してセマンティックな結果をつくり出す。検索の結果はだいたい正確だ。
yamadacomma | Shared With: Everyone - Jun 09 2008 | 広告, セマンティック, 健康
Quoted: 健康に関するサイトに独自のネットワークが必要だとして、Healthlineは同社のセマンティックな検索技術を広告に利用している。その健康に関する検索エンジンのHealthlineが、健康関連のウェブサイトにコンテクスチュアルな広告を掲載するネットワークのHealth Media Networkをローンチする。いうなれば、健康関連のサイトのAdSenseのようなものだ。
しかし、広告が配信されているページ上のキーワードとの単なる一致に頼るのではなく、ページ上の健康のコンセプトにマッチする広告を配信することができるため、医学用語の「肋軟骨炎」(肋骨の炎症)に言及している記事には、イブプロフェン(最も一般的な治療法)の広告が出るだろう、とHealthlineは話す。
Healthlineは自社の検索エンジン用にすでに健康に関する用語やコンセプトに関連した20万語の分類を作っており、新しい広告ネットワークにもそれと基礎を同じくする技術を使っている。そして、自社の検索エンジンとUnited Healthがまもなく始めるMyOptumHealth、AARP、Health.com、HealthPricer、JustAnswer、USNews.comなどのパートナーサイト上で、健康に関するコンテクスチュアルな広告を供給することになっている。Healthlineによれば、これらのサイト利用者は総計で月1000万人になるという。
yamadacomma | Shared With: Everyone - Jun 04 2008 | 検索, セマンティック
Quoted: 検索結果のレレバンシーでリーダーになろうという決意を持って取り組んでおりますし、またマルチメディア検索という点でもリーダーを目指しています。将来的なステップとしては、アルゴリズムから得られた結果とマルチメディアコンテンツを統合し、今後2年間のあいだに最も興味深い結果を出すことを目指しています。それから、マルチメディア以降に何を目指すかと申しますと、もっと幅広い考えを持っております。例えば、Google式の検索はキーワードを URLに対してマッピングしようとしているのに対して、我々はそれだけではありません。いかにして直接、人とコンテンツをつなぐことができるかということに注目しております。
ユーザーパラダイムとしては、私はGoogle式の検索をヒット・アンド・ラン形式と呼んでいます。それはすなわちキーワードからURLを得て、そしてできる限りそれにアクセスさせるというやり方です。ある特定のウェブサイトを探すときには、そういったことを望んでいる人もいるかもしれませんが、ユーザーは必ずしもそれだけを意図しているわけではありません。例えば、「デジカメ」というキーワードを入力したとします。あるいは「日本での休暇」と入力したとします。そうすると、ある特定のウェブサイトを自分が探しているわけではなく、それよりもウェブ全体を探索したいわけですから、ただ単にキーワードをURLとマッピングすることだけを望んでいるわけではありません。
ディレクトリベースの検索からキーワードベースの検索に移行しましたが、将来は徐々にセマンティックな、コンテンツやユーザーを理解した検索に移行していくと思います。あるいは、ユーザーの意図を組み込んだ検索になっていくと思います。
面白いことに、世界的に見られる現象として、検索結果により多くの情報が取り込まれています。例としては、インスタントアンサーというようなものが挙げられます。Google OneBoxなども同様で、クエリーを入れることによって、そのアルゴリズムの検索結果が全部揃う前に、データやコンテンツが現れます。例えば、天気予報の情報あるいは映画の上映時間とか交通状況とかそういったものです。以前だったら他のウェブサイトを見ていたところを、今は検索結果の領域の中にいろいろな情報を取り込もうとしているわけです。そういったことは、今後も強化していきたいと考えております。
ウェブのあらゆるものを取り込めるように投資を進めていきます。例えば、Q&A、あるいは特定分野における検索エンジンなどです。今までは動画や画像などがありましたが、今後は医療情報も入りますし、我々は米国で旅行関係の検索会社であるFarecast.comを買収したばかりです。こうして特定分野におけるエクスペリエンスを検索の中に取り込んでいきますと、より複雑なインターフェースが求められます。そういったところで、Microsoftが今まで持っていた強みを活かすことができるわけです。その部分には相当経験を持っています。
キーワードは、入力の方法としては、これからも依然として支配的なやり方になるだろうと思います。というのは、人々は非常に若いうちから、自分を表現するために言語やキーワードを学ぶわけです。しかし、それは自分の意図を示す唯一の方法ではないと思います。画像検索を行っていくつかの画像が出てきましたが、ユーザーの意思を指定することによって、より絞っていくというやり方です。すなわち、「パリ」という言葉を入力したとします。そこで意図しているのは、場合によっては有名人のパリス・ヒルトンかもしれません。あるいはパリの町かもしれません。そこで出てきた検索結果の画像の中からエッフェル塔を選ぶことによって、もっとこういうものを目指しているのだという意図を示すことができるので、それによって結果のランクが変わることが考えられます。キーワードには表現力があるわけですが、自分の意図を完全に表現するには不十分ですので、他のやり方でキーワードを補完し、より自分の意図を表現することができるようになるということです。
yamadacomma | Shared With: Everyone - May 26 2008 | 検索, 広告, 自然言語処理, セマンティック
Quoted: 検索マーケットに支配的な企業が存在した場合、どういうことが起きるかすでに知っている。イノベーションにはさして力が注がれず、システムの改善を図る企業が現れてもそこへ十分な売り上げが回らないことになる。全エコシステムが危機に瀕するのだ。
たとえば、CPC(クリック単価)モデルには根本的な欠陥がある。しかしGoogleにとってクリック詐欺は利益になるので、対策を手ぬるいままに放置してしてきた。これに対して広告主は検索エンジンのレベルでは対策しようにも打つ手がないのだ。CPA(成果単価)のほうがずっと良いモデルだが、Googleはテストしてみる以上のことをしようとしない。現在のシステムはGoogleにとって有利で、広告主にとっては不利である。しかし広告主にとっては実質的にGoogle以外の選択肢がない。Googleが60+%の検索市場(そしておそらく90%くらいの検索売り上げ)を独占しているので、我慢して付き合っていくしかないのだ。Microsoftの最近のLive Searchキャッシュバックプログラムは競争こそがより効率的なシステムを作ることを改めて実証した。
サイト運営者の側から見ると、状況はさらに悪い。Googleは広告料金のうちから掲載者に対してはしみったれた割合しか分配しようとしない。Googleをまずまず正直にさせるのはYahooとMicrosoftが時折サイト運営者のところに来て競争をしかけるときだけだ。もしそれさえなくなってしまえば、Googleはサイトから上がる広告収入のほとんどを独り占めしてしまうだろう。(Googleの競争相手はそうなると検索以外の〔バナーなどの〕広告となるが、これははるかに低い収入しかもたらさない)。こういったことはすべて、インターネットの健全性という見地からした場合、最悪である。
オンライン広告市場はあまりに巨大で重要なのでMicrosoftはとうてい無視することができない。われわれインターネット・ユーザーはMicrosoftとYahooの努力を応援しなければならない。もし彼らが興味を失ってしまえばインターネットは重大な悪影響を被るからだ。競争こそがイノベーションを生む。競争こそが価格の引き下げを生む。競争を放棄せよと説くのは無責任以外のなにものでもない。
yamadacomma | Shared With: Everyone - May 26 2008 | SEO, セマンティック, トレンド, カテゴライズ
Quoted: 謎なんだけど興味をそそるロシア発のプロジェクト。サイトのSEO分析ツールで名前を「TheRarestWords」という。とにかくURLを入力するとそのトップページに出ている最も稀少なキーワード(つまり検索エンジン経由でトラフィックを誘導してくれる可能性が最も高い言葉)と、関連キーワードで探せる他のサイト、これらキーワードにフィットしそうなカテゴリ一覧を表示してくれるのだ。マイクロソフトのサイトの場合、ここ固有の稀少なキーワードは「silverlight」、「biztalk」、「onecare」、「skydrive」、「popfly」、「バルマー(ballmer)」、そして「オジー(ozzie)」。自分のサイト確かめたくなった人は、「 http: //therarestwords.com/あなたのサイト.com 」に自分のURL入れて試すことができる。
TheRarestWords では誰でもキーワードごとに100字の定義が書き込める。こうして大衆知(クラウド・インテリジェンス)を活用することでサイトのカテゴリ分け作業にもセマンティックな強みを活かしている。かなり簡単にやらせが利くものだけど、当座は単なるWebプロジェクトを目指している。LingozやWiktionaryのようなWiki辞書作りにも活用できそうだが、それも本プロジェクトの中心課題ではないようだ。
開発者はミステリアスなロシア人。
こやつはサイトで最も頻繁に使われてる単語がどれで、最も使用頻度が低い単語がどれで、全く使われない単語がどれか、調べてくれる。今はドメインの最初のページに出てるワードしか拾わない。そこより深くは進まない。ところがこのスパイダー、沢山ドメインを回って結構なんだかんだで2000 万ワードもの単語をインデックスしてしまった。
製作者はこんな新オプションを実装したがっている。:
* トレンド発見(どの単語が人気上昇中か ―例えば「django」が人気上昇中で、「python」は相変わらず手堅い人気、「perl」みたいな人気下降中の単語はどれか)
* パパ&ママが切り回しているような(小さな家族経営の)ビジネスサイトに向けたSEO支援(この観点からなら役に立つものにできるんじゃないかと、製作者は話している)
* サイトの自動カテゴリ分け。大きなカテゴリ一覧を出すのではなく(実は現段階でこれはもう実装済みなんだけど、まだアルゴリズムを完成させなくてはならない)
最初行った人はインターフェイスが分かりづらいと思うけど、サイトにはなかなか面白いデータがある。例えば2つのサイトをSEO fight(SEO対戦)させたりもできる。アドレスを「 http://therarestwords.com/vs/あなたのサイト.com/ライバルのサイト.com 」と入力するだけでオーケーだ。この機能では自分のサイトが抱え持っている稀少ワードでライバルが持ってないワードがなんで、その逆が何か分かる。
例えば、こちらは「TechCrunch Vs. GigaOm」の対戦結果だ。 各ブログのフロントページにあるスナップショットしか比べてないんだけど、現時点でこちらの検索トラフィック率の高いキーワードは「friendfeed」、「gamestop」、「ブロゴスファ(blogosphere)」とある。一方GigaOmがこっちの尻を蹴とばしてるキーワードは「クアルコム(qualcomm)」、「powerset」、「嫌味(sarcasm)」だ(これは少なくともエントリ公開前の話だからね。何がなんでも「嫌味(sarcasm)」だけは絶対Omに負けられない)
http://therarestwords.com/
yamadacomma | Shared With: Everyone - May 07 2008 | タギング, セマンティック, タグ
Quoted: ブックマークとかタグづけサービスはやっかいな仕事になりがちだ。新しいサイドバーベースのプラグインZigtagは、クリーンですっきりしたブックマークとタグづけの提供を目指している。このプラグインは、200万以上のタグを持ったセマンティック辞書を導入することで、山ほどあるタグづけサービスと差別化を図っている。基本的なアイデアは、タグが定義されるたびに、同じ意味のタグ(例えばニューヨーク市とビッグアップル)が自動的にリンクされるというものだ。これによって以後のブックマーク探しが容易になるはず。
あるページに適当なタグを付けると、それにマッチするキーワードのリストが提示されるが、これらはZigtagのデータベースで定義されたものだ。例えば、検索欄に「アップル」と入力すると、「コンピュータ会社」、「ナシ科の果実」、「レコード会社」といった候補から選ぶことができる。この作業は楽にできるし、統合辞書もかなりよく網羅されている。たまたま未定義の言葉に出会ったら、それを辞書に追加してくれるように簡単にリクエストできる(自分だけの一時タグを置くことができる)。
タグづけ機能のほかに、ZigtagにはDigg風の評価投票システムもあり、Zigtagホームページでブックマークされた人気サイトのリストに反映される。また基本的なソーシャルネットワーキング機能をいくつか備えていて、グループ用のプライバシーや友人との共有について設定できる。
Zigtagにとっての最大の問題は、すでに他のソーシャルブックマーキング・サイト(有名なところだけでもDelicious、Diigo、Twineなど)が存在していることだ。セマンティックなタグづけ機能はかなりユニークだが、どれだけアピールできるかは、未知数だ。とくにTwineのような自動セマンティック・タグづけ機能を持ったサービスとの比較が問題になる。率直に言って、多くの人は単純だが有効なDeliciousのインタフェースを使い続けると思う。
http://www.zigtag.com/
yamadacomma | Shared With: Everyone - Apr 08 2008 | 検索, 自然言語処理, セマンティック
Quoted: Powersetは「ここ数週間のうちに、永らくお待たせしたベータ版の一般公開に踏み切る予定だ」と告げてきた。Powersetは自然言語を理解する新しい種類の検索エンジンを開発中で、これによって現在市場を支配しているキーワードによる検索エンジンに挑戦しようとしている。
この検索エンジンの初期バージョンはエンジンのコンセプトとユーザーインタフェースのデモ用で、まだウェブ全体を対象として検索が可能なところまでいっていない。現在Powersetが検索できるのはWikipediaとFreebaseだけだ。しかし、このサービスをテストしてみて、私は初めてGoogleを使ったときに似た「おお!」という感覚を味わった。簡単に言えば、このサービスは検索分野においてきわめて革新的で、もしかすると革命的とさえいえそうな大きな進歩をもたらしたと思う。
もっとも同社が現在までに成し遂げたのは2つのサイトだけを相手にしたごく小さな索引づけだという点は割り引いて考えねばならない。さらに Powersetは検索エンジンを欺こうするスパムその他の問題に対してなんら対策を講じていない(この点がGoogleをかくも偉大な検索エンジンにした)。こういった点、まだGoogleへの挑戦者と呼ぶにはほど遠い。しかし誰でも一度使ってみれば、これがウェブ全体で利用できるようになったときの潜在的な影響の大きさを感じることができるはずだ。
今のところ、Powersetではこの検索エンジンの詳しい機能をまだ秘密にしているが、2007年半ばごろにスクリーンショットが公開された頃に比べて機能は大きな前進をみていると思う。
Powersetは検索エンジンの分野で目を話さず観察している3社のうちの1社だ。他の2社は Cuill (クールと発音する)とBlekkoだが、どちらもまだ完全なステルスモードだ。
http://www.powerset.com/
http://www.crunchbase.com/company/cuill
http://www.crunchbase.com/company/blekko
yamadacomma | Shared With: Everyone - Mar 07 2008 | ニュースアグリゲート, 感情分析, 意味解析, セマンティック
Quoted: Microsoft Researchが発表した新しいニュース・アグレゲーター「Microsoft Blews 」の話。これはニュース・アグレゲーターである。(同種のものとしては、Techmemeその他約45件ほど)。しかし、Blewsが提供するのは、誰がどのページにリンクを張っているかをほぼリアルタイムで分析して重要性を判断し、カテゴリーを分類するという定番の機能だけににとどまらない。このサービスはもっぱら政治ニュースだけを扱うが、記事の政治的立場が保守かリベラル寄りかまで判断する。
BLEWSは記事が保守的ブロゴスフィアで受け入れられているか、リベラル寄りブロゴスフィアで受け入れられているかを基準に用いて分類を行う。記事に対する保守ブログとリベラル・ブログのそれぞれからのリンクをビジュアル化して表示する。また問題のニュース記事あるはテーマが政治的感情に訴えかける力の強さも推定する。BLEWSはまた「ものごとを両面から見る」アプローチを採用しており、読者は同一の記事に対する異なる政治的立場からの見解を知ることができる。BLEWSはこの目的を達成するため、LiveLabsの「Social Media」プラットフォームが提供するリアルタイムのフィード を利用して政治ブログ記事を収集、分析する。
Blewsが用いているAI技術はなかなか面白い。単なるキーワード検索(たとえばPowerset)は別としてコンピュータ・アルゴリズムのみでテキストから感情や意味を判定するのは非常に困難だ。Microsoftはこの「感情的強度」の分析も行っているとしている。これがうまく行けば、あるいはそこそこ近い判定ができる程度でも、この技術には無数の応用の可能性がある。
ちなみに、BlewsはScoutLabsにも似ている。Scout Labsはブランド広告の広告主がそのブランドに対するウェブでのコメントをモニタして、そのブランドへの好感度を推測しようというものだった。
http://research.microsoft.com/projects/blews/blews.aspx
Related Content from Around Faves
広告
-
Quoted: ヤフーは、「Yahoo!地図情報」でベータ版として提供してきた「スクロール地図」をリニューアルし、正式版に移行したことを明らかにした。見やすい新デザインの地図表示に切り替えたほか、一部のエリアでは航空写真を最新のものに更新している。
ベータ版段階の2月22日からは、コンテンツマッチ広告も導入されていた。表示している地図の住所情報に関連する広告が、地図画面の右側に表示されるようになっている。これは、Yahoo! JAPANとオーバチュアとの地域広告に対する新しい試みだとしている。
2 FaversViewed: 11 Times - oke - Apr 07 20073 FaversViewed: 7 Times
- oke - Jun 05 20072 FaversViewed: 5 Times
