Permalink
yamadacomma on 自然言語処理
  • vote
    1
    0 starsyamadacomma | Shared With: Everyone - Nov 05 2008 | 自然言語処理, ブランド, メディア
    Perspctvが単語のメディア登場回数を追うマーケター用マッシュアップ公開へ

    Quoted: Perspctvの本領は「マーケターも自ブランドが様々なメディアでどう話題になってるかモニターできる」ところにある。サイトをマーケター用のニューメディアのダッシュボードに変える予定だ。今でも既に単語を検索して、それがオンラインでどれだけ話題になっているかチェックは可能になっている。
    PerspctvではこのようなシェアをブログならTechnorati、ニュースならDaylife、検索件数はGoogle Insightsから入ってくるデータを基にチャートで表示している。チャート下にはフィードが3カラムあって、各検索タームに関する最新のブログ投稿、つぶやき(Tweets)、ニュース(ソースはMSN Live News Search)もチェックできる。
    検索語はブランド名から社会問題まで何でもOKだ。
    http://www.perspctv.com/

  • vote
    1
    0 starsyamadacomma | Shared With: Everyone - Nov 05 2008 | セマンティック, 自然言語処理, リファレンス
    公開ベータに入ったJuiceを飲んでFirefoxをパワーアップしよう

    Quoted: Linkool Internationalが開発したFirefoxブラウザのサイドバーJuiceが、公開ベータに入った。この強力なプラグインは、ユーザが言葉を検察したり強調表示にすると、関連する情報を自動的に集めてくれる。便利なリファレンスツール(参考資料を集めるツール)なので、一度使うと習慣的に使うようになる。またメディアストレージツールの機能も持っていて、ビデオや画像のファイルをサイドバーへドラッグ&ドロップすると、それらを後で見れるように保存してくれる。
    Juiceが情報を探す先は、Wikipedia、Google News、YouTube、CrunchBaseだ。これらからJuiceは、いわば、ユーザがよく知らない言葉に関する“一目で分かる用語解説”のような参考記事を作ってくれる。このサイドバーはとても洗練されていて、インラインビデオの再生や、長〜短2タイプに伸縮できる要約記事も提供する。メディアストレージ機能は、とても使いやすい。
    Juiceは北京のLinkool Labsの最初のアプリケーションで、同社の“インテリジェントな発見エンジン”と“自然言語処理”、そして“辞書管理システム”を一体化してセマンティックな結果をつくり出す。検索の結果はだいたい正確だ。

  • vote
    1
    0 starsyamadacomma | Shared With: Everyone - Aug 21 2008 | 自然言語処理, Webサービス
    ヤフー、係り受け解析と指定形容詞係り先検索をWebサービスで提供

    Quoted: ヤフーは、開発者向けに同社サービスの技術仕様を公開するサイト「Yahoo!デベロッパーネットワーク」で、新たなWebサービス「日本語係り受け解析Webサービス」と、「指定形容詞係り先検索Webサービス」を提供開始した。
    日本語係り受け解析Webサービスは、日本語文の係り受け関係を解析する。指定形容詞係り先検索Webサービスは、指定した形容詞が係る名詞句群を返す。
    これらはテキスト解析Webサービス群の一部として公開されている。同じカテゴリには、「日本語形態素解析Webサービス」「かな漢字変換Webサービス」「ルビ振りWebサービス」「校正支援Webサービス」もある。
    http://developer.yahoo.co.jp/jlp/

  • vote
    1
    0 starsyamadacomma | Shared With: Everyone - May 29 2008 | 自然言語処理, 評判分析
    SezWho買収により文脈解析を強化

    Quoted: プラグインをインストールしているブログおよび他の意見交換プラットフォームの間で、コメントを書いた人の評判を追跡調査するSezWhoが、文脈解析に特化したTejitというスタートアップを買収した。
    SezWhoは人々の専門分野毎の評判を評価する試みだ。したがってスポーツに関するブログで洞察力のあるコメントを書いても、なにかの拍子にスポーツの話にならない限り、技術ブログ上における評判が必ずしも上がるというわけではない。
    現在のところSezWhoは話題の範囲を、記事に関連付けられたタグなどの簡単な指標でチェックしている。しかしTejitの文脈解析技術を使えば、コメントを寄せた議論を実際に解析して、その議論の範囲をより効果的に決定することができるようになる。
    Khaitanは、ブログの世界にある冗長なコンテンツを識別するために2007年にTejitを開始した。現在のところ500万のブログを解析している。
    コメント機能を拡張しようとするライバルにはDisqus、JS-Kit、およびIntense Debateなどがある。

  • vote
    1
    0 starsyamadacomma | Shared With: Everyone - May 26 2008 | 検索, 広告, 自然言語処理, セマンティック
    検索市場に競争は必須だ

    Quoted: 検索マーケットに支配的な企業が存在した場合、どういうことが起きるかすでに知っている。イノベーションにはさして力が注がれず、システムの改善を図る企業が現れてもそこへ十分な売り上げが回らないことになる。全エコシステムが危機に瀕するのだ。
    たとえば、CPC(クリック単価)モデルには根本的な欠陥がある。しかしGoogleにとってクリック詐欺は利益になるので、対策を手ぬるいままに放置してしてきた。これに対して広告主は検索エンジンのレベルでは対策しようにも打つ手がないのだ。CPA(成果単価)のほうがずっと良いモデルだが、Googleはテストしてみる以上のことをしようとしない。現在のシステムはGoogleにとって有利で、広告主にとっては不利である。しかし広告主にとっては実質的にGoogle以外の選択肢がない。Googleが60+%の検索市場(そしておそらく90%くらいの検索売り上げ)を独占しているので、我慢して付き合っていくしかないのだ。Microsoftの最近のLive Searchキャッシュバックプログラムは競争こそがより効率的なシステムを作ることを改めて実証した。
    サイト運営者の側から見ると、状況はさらに悪い。Googleは広告料金のうちから掲載者に対してはしみったれた割合しか分配しようとしない。Googleをまずまず正直にさせるのはYahooとMicrosoftが時折サイト運営者のところに来て競争をしかけるときだけだ。もしそれさえなくなってしまえば、Googleはサイトから上がる広告収入のほとんどを独り占めしてしまうだろう。(Googleの競争相手はそうなると検索以外の〔バナーなどの〕広告となるが、これははるかに低い収入しかもたらさない)。こういったことはすべて、インターネットの健全性という見地からした場合、最悪である。
    オンライン広告市場はあまりに巨大で重要なのでMicrosoftはとうてい無視することができない。われわれインターネット・ユーザーはMicrosoftとYahooの努力を応援しなければならない。もし彼らが興味を失ってしまえばインターネットは重大な悪影響を被るからだ。競争こそがイノベーションを生む。競争こそが価格の引き下げを生む。競争を放棄せよと説くのは無責任以外のなにものでもない。

  • vote
    1
    0 starsyamadacomma | Shared With: Everyone - Apr 08 2008 | 検索, 自然言語処理, セマンティック
    自然言語検索のPowerset、ここ数週間でローンチか

    Quoted: Powersetは「ここ数週間のうちに、永らくお待たせしたベータ版の一般公開に踏み切る予定だ」と告げてきた。Powersetは自然言語を理解する新しい種類の検索エンジンを開発中で、これによって現在市場を支配しているキーワードによる検索エンジンに挑戦しようとしている。
    この検索エンジンの初期バージョンはエンジンのコンセプトとユーザーインタフェースのデモ用で、まだウェブ全体を対象として検索が可能なところまでいっていない。現在Powersetが検索できるのはWikipediaとFreebaseだけだ。しかし、このサービスをテストしてみて、私は初めてGoogleを使ったときに似た「おお!」という感覚を味わった。簡単に言えば、このサービスは検索分野においてきわめて革新的で、もしかすると革命的とさえいえそうな大きな進歩をもたらしたと思う。
    もっとも同社が現在までに成し遂げたのは2つのサイトだけを相手にしたごく小さな索引づけだという点は割り引いて考えねばならない。さらに Powersetは検索エンジンを欺こうするスパムその他の問題に対してなんら対策を講じていない(この点がGoogleをかくも偉大な検索エンジンにした)。こういった点、まだGoogleへの挑戦者と呼ぶにはほど遠い。しかし誰でも一度使ってみれば、これがウェブ全体で利用できるようになったときの潜在的な影響の大きさを感じることができるはずだ。
    今のところ、Powersetではこの検索エンジンの詳しい機能をまだ秘密にしているが、2007年半ばごろにスクリーンショットが公開された頃に比べて機能は大きな前進をみていると思う。
    Powersetは検索エンジンの分野で目を話さず観察している3社のうちの1社だ。他の2社は Cuill (クールと発音する)とBlekkoだが、どちらもまだ完全なステルスモードだ。
    http://www.powerset.com/
    http://www.crunchbase.com/company/cuill
    http://www.crunchbase.com/company/blekko

  • vote
    1
    0 starsyamadacomma | Shared With: Everyone - Mar 28 2008 | 自然言語処理, コンテキスト, リコメンド
    ブログ用コンテンツ推奨エンジン? 使えるかも…

    Quoted: アルファ版をスタートしたZemantaは、ヨーロッパのスタートアップで、自社開発の意味解析エンジンを利用して、コンテキストに関係のあるリンクや画像、関連コンテンツ、タグなどの推奨を行うWordpressのプログ用機能を開発した。いずれは、分野に特化した推奨(ハイテク、SEO等)を行うサードパーティー用のタブとも統合する予定だ。要するに、ブログ記事を書き始めると、Zemantaがそれを見ていちばん合いそうなリンクをテキストに追加する。ユーザーはそれを編集できる(ほとんどのブロガーが間違いなくやりたがること)。さらに、関連記事へのリンクも作ってくれる。この種のアプリケーションが、学術用や企業用のコンテンツ管理システムによくみられるが、ウェブ用にはこれまであまり出てこなかったのは、非常にCPUや資源を食う技術だからだった。ZemantaはAkismetと同じように、コンテンツを高度に解釈することによって何をすべきかを判断するウェブサービスAPIだ。
    http://zemanta.com/

  • vote
    1
    0 starsyamadacomma | Shared With: Everyone - Dec 18 2007 | 自然言語処理, 口コミ
    Summize:「レビュオスフィア」のための意見分析エンジン

    Quoted: ネットで製品レビューを読んでいると、ものすごく時間がかかることがある。みんなが何を考えているかを知るには、時間もかかるし、選り分けるのも大変だ。本や映画やCDやガジェットについて、みんなの意見の総まとめが見たければ、Summizeで調べてみよう。
    Summizeは、何十か所かのレビューサイトと、「レビュオスフィア」と呼ぶ50万件のブログにわたって、人気分析を行う。この中には、AmazonやCNet、IMDB、Epinions など、ランク付けや、レビューなど構造的なデータを持つ本格的レビューサイトもあれば、構造もなく選別もされていない記事満載のブログも含まれている。その意味でこのサイトは、CNetの MetacriticとBlogcriticsの中間に位置しているといえる。
    レビュー記事の文章を解析し、偏向したことばとユーザーが与えた星の数との相関を調べている。偏向したことばについてわれわれが持っている知識を使い、構造のないブログ記事から意見を抽出して、アルゴリズムに基づいてランク付けをしている。
    Summize はあらゆる意見を刈り取ってきて、「スニップ」と呼ばれる1枚の温度分布グラフにまとめる。これは、カラースペクトルのような帯状のグラフで、赤(最悪)から黄色(ふつう)、緑(最高)まで色が変わっていく。あらゆる製品について、一目で全体的な意見の傾向がわかるようにするのが狙い。もうひとつ、どの製品にも、Amazonライクの協調フィルタリングをひと工夫した関連商品の一覧がついている。Radioheadの場合なら、「Radioheadについて書いているブロガーはこれについても書いています」、として Band of Horse、The Pixies、Idelwildなどがリストされている。
    Summizeでは、旅行やレストランなどの新しいカテゴリーも将来追加する計画だ。
    http://www.summize.com/

  • vote
    1
    0 starsyamadacomma | Shared With: Everyone - Sep 10 2007 | スタートアップ, 自然言語処理, 自動リンク
    欧州投資家が惚れ込む起業家とは?「Seedcamp」最終選考発表

    Quoted: 欧州スタートアップ企業育成のための新インキュベータ式公募「Seedcamp」の優勝者が発表になった。
    Zemanta(スロベニア)が構築したのは、コンテンツをネットで見れるよう自動的に最適化できる“コンテンツ・インテリジェンス”なプラットフォーム。それで何ができるの?だが、テキストをこれに貼り付けるとZemantaが内容を吟味して、そのコンテンツに最もありえそうなリンクを張ってくれるのだ。で、これを自分で編集することができる、というわけ(ブロガーなら飛びつくこと請け合い?)。この種のアプリは学術界や法人用のコンテンツ管理システムでは沢山出回っているが、ネットではこれまであまり見かけなかった。というのもCPUとリソースが集中的にかかるテクノロジーだからね。同社のウェブサービスのAPIではコンテンツの内容を吟味し、どう扱うべきか考えてくれる、その辺が Akismetに似てなくもない。
    http://www.zemanta.com/en/zaug/

  • vote
    1
    0 starsyamadacomma | Shared With: Everyone - Aug 27 2007 | ニュースアグリゲータ, 自然言語処理, セマンティック
    Stocks.usは、TechMemeの株式ニュース版クローン

    Quoted: Stocks.usというサイトがあるようだ。上場企業の株価関連ニュースをアグリゲートするサイト。
    サイトでは主要メディア(ロイター、WSJ、USATodayなど)発の情報をグループ分けしている。 ネタとして採り上げる媒体が多い記事ほどサイト上位に上がる仕組み。最新ニュースは右のサイドバーにリンクが出て、更新は15分置きに行う。
    このようなアグリゲータ構築の一番の難しさは、どの記事とどの記事が関連性があり、どうしたら正しくグループ分けできるか、という部分にある。 TechMemeはブログ同士のリンクを手がかりにしているが、主要ニュースサイトは互いにリンクを張らないものなので、Stocks.usでは代わりにキーワードとセマンティック分析を活用しているのではないかと思う。
    http://stocks.us/

1 - 10 of 25 Faves

Related Content from Around Faves

検索

VIEW ALL

口コミ

  • zaqw2
    Aug 07 2008

    このブログは、C・S・C出版 岡本一成さんの簡単エスカレーター式ダイエットの口コミ 感想 レビュー 評価 購入者の声 評判 ブログ 検証 暴露 比較 ランキング クチコミなどの情報を公開しているブログです。

    2 FaversViewed: 5 Times
VIEW ALL