研究者データベース

小山 聡 (オヤマ サトシ)

  • データサイエンス学部 教授
Last Updated :2024/06/11

研究者情報

学位

  • 修士(工学)(京都大学)
  • 博士(情報学)(京都大学)

J-Global ID

研究キーワード

  • 人工知能   機械学習   ヒューマンコンピュテーション   量子機械学習   

研究分野

  • 情報通信 / 知能情報学
  • 情報通信 / データベース

経歴

  • 2023年04月 - 現在  名古屋市立大学教授
  • 2009年10月 - 2023年03月  北海道大学准教授
  • 2015年01月 - 2015年11月  New York UniversityVisiting Research Professor
  • 2007年04月 - 2009年09月  京都大学助教
  • 2002年04月 - 2007年03月  京都大学助手
  • 2003年05月 - 2004年03月  Stanford UniversityVisiting Assistant Professor
  • 2001年04月 - 2002年03月  独立行政法人日本学術振興会特別研究員

学歴

  • 1999年04月 - 2002年03月   京都大学   大学院情報学研究科   社会情報学専攻
  • 1994年04月 - 1996年03月   京都大学   大学院工学研究科   数理工学専攻
  • 1990年04月 - 1994年03月   京都大学   工学部   数理工学科

所属学協会

  • 情報処理学会   Institute of Electrical and Electronics Engineers (IEEE)   日本データベース学会   The Association for the Advancement of Artificial Intelligence (AAAI)   人工知能学会   The Association for Computing Machinery (ACM)   電子情報通信学会   

研究活動情報

論文

書籍

講演・口頭発表等

  • 小山 聡; 馬場 雪乃; 櫻井 祐子
    人工知能学会全国大会論文集 2013年 人工知能学会
  • 小山 聡; 白砂 健一; 田中 克己
    人工知能学会全国大会論文集 2008年 人工知能学会
  • 小山 聡; 田中 克己
    人工知能学会全国大会論文集 2007年 人工知能学会
  • 小山 聡; 田中 克己
    電子情報通信学会技術研究報告. AI, 人工知能と知識処理 2006年05月 一般社団法人電子情報通信学会
     
    本稿では,オブジェクト識別を行う際にクラスタリングで用いる距離を,人間の教師を必要とせずに学習する手法を提案する.提案手法は,別名の別オブジェクトへの対応と名前の恣意性という2つの仮定に基づいている.これらの2つ仮定が成り立てば,異なる名前を含むデータ対をリンク不可な例題として学習した距離を,同じ名前を持つデータのオブジェクト識別に用いることが正当化できる.リンク不可なデータ対のみを例題として用いる距離の学習は,凸2次計画問題として定式化され,一般の距離行列を学習する際に必要な半正定値計画問題よりも,高速に解くことが可能である.文献データベースを用いた実験により,学習された距離が識別の適合率と再現率を向上させることが確認された.
  • 文章構造を利用したWebからの話題発見  [通常講演]
    電子情報通信学会第14回データ工学ワークショップ (DEWS2003) 2003年
  • 小山 聡; 田中 克己
    電子情報通信学会技術研究報告. DE, データ工学 2002年07月 一般社団法人電子情報通信学会
     
    ユーザが検索エンジンに複数のキーワードを入力した場合,これらのキーワードには,対象となる話題を表現する際の異なった役割が想定されている場合が多い.例えばあるキーワードは主題を表し,別のキーワードは話題の範囲を限定するといったような場合である.同じキーワードからなる検索式であっても,このようなキーワードの役割を区別することで,検索結果を向上できる可能性が考えられる.本論文では,既存の検索エンジンの検索機能を利用し,主題に含まれるキーワードと文章の内容に現れるキーワードを区別した質問,および単純なキーワードの論理積の質問,の2種類の質問の検索結果を比較する予備実験を行った,結果は,二つの質問で検索されるページの内容に違いが現れるというものであった.そこで,我々は予備実験の設定を一般化し,話題の階層構造を反映したWeb検索方式を提案する.さらに,提案手法の応用例として,質問の修正に用いる方式と,検索結果の組織化に用いる方式の検討を行う.
  • 話題の階層構造を反映したWeb検索手法の提案  [通常講演]
    情報処理学会研究報告 2002年
  • ドメイン指向Web検索のためのドメイン判別ブール式の抽出  [通常講演]
    第15回人工知能学会全国大会 2001年
  • 情報ナビゲーションへの連想ルールの適用  [通常講演]
    電子情報通信学会「ソフトウェアエージェントとその応用」特集ワークショップ(SAA2000) 2000年
  • コミュニティ情報流通プラットフォームの構築  [通常講演]
    第9回マルチエージェントと協調計算ワークショップ(MACC2000) 2000年

MISC

受賞

  • 2021年11月 情報処理学会北海道支部 学術研究賞
  • 2020年12月 情報処理学会北海道支部 学術研究賞
  • 2016年03月 日本データベース学会 若手功績賞
  • 2015年08月 Journal of Advanced Computational Intelligence and Intelligent Informatics (JACIII) Best Paper Award 2015
  • 2015年02月 特定非営利活動法人ソフトウェアテスト技術振興協会 善吾賞
  • 2011年03月 The 10th International Symposium on Web and Wireless Geographical Information Systems (W2GIS 2011) Best Paper Award
  • 2010年10月 情報処理学会北海道支部 技術研究賞
  • 2010年03月 第2回データ工学と情報マネジメントに関するフォーラム(DEIM 2010) 優秀論文賞
  • 2010年03月 日本データベース学会 上林奨励賞
  • 2006年06月 人工知能学会 論文賞

共同研究・競争的資金等の研究課題

  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2022年04月 -2025年03月 
    代表者 : 野田 五十樹; 小山 聡
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2018年04月 -2022年03月 
    代表者 : 小山 聡
     
    ヒューマンコンピュテーションにおいて人間にタスクを依頼する際には、その意図を明確に説明することが作業結果の品質向上に不可欠である。例えば、よく似た2つのクラスの画像の分類を作業者に依頼する場合、ある画像がなぜクラスAではなくクラスBであるのかを、明確に説明できることが重要である。反事実的画像説明はこのような説明を具体的な画像を用いて実現する方法であるが、既存の方法は生成される画像に不自然さが残るといった課題があった。そこで本研究では、深層生成モデルを用いて、より自然な反事実的画像説明を生成する方法を開発した。生成した画像説明をクラウドソーシングで作業者に提示する実験を行い、作業品質が向上することを確認した。また、深層生成モデルを用いて画像を生成する際、利用者が望む画像が生成されるように出力を制御可能であることが望ましい。そこで、教師なし学習であるクラスタリングと組み合わせて、人間に理解しやすい潜在特徴が自動的に獲得できる方法を提案した。提案手法は、データに全くラベルが与えられていない教師なし学習と、一部のデータにラベルが与えられている半教師付き学習の両方の問題設定において、新規データのラベルを潜在特徴として精度よく推定することができ、さらにこのラベルを変更することで、出力する画像を変化させることができる。文字画像およびファッション画像のデータセットにおいて提案手法の有効性を検証した。これまでにレビュー文や知識グラフを利用して取り組んできた推薦システムの研究において、知識グラフ上での探索にランダムウォークを利用する方法を導入した。これにより、ユーザとアイテム間のメタパスレベルの類似度を推薦に活用することを可能とした。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2015年04月 -2019年03月 
    代表者 : 小山 聡; 宋 静
     
    本研究では,クラウドソーシングによって多くの人々の能力を活用してオープンデータの分析を行うための基盤技術の研究を行った.とくに,相関関係ではなく因果関係を分析するタスクに着目し,クラウドソーシングで人間の知識を活用して因果関係の影響を与える変数の候補を発見し,探索的にオープンデータの分析を行うフレームワークを開発した.世界銀行や日本政府のオープンデータなどを用いて,各要素技術およびフレームワークの評価を行った.
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2015年04月 -2018年03月 
    代表者 : 小山 聡; 櫻井 祐子; 高瀬 朝海; 新 恭兵; 森瀬 寛己; 関屋 亮太
     
    本研究では,計算機による情報処理の中で人間の能力を積極的に活用するというヒューマンコンピュテーションの考え方をさらに推し進めて,ヒューマンコンピュテーションの品質制御自体に人間の能力を活用する方式を追求した.確信度判断や多面的な評価といった人間の高度な認知能力と,計算機の高速かつ高精度な計算能力を利用した品質制御モデルを開発した.画像認識や推薦システム,教育といった様々な分野において,実サービスのデータや,実際の作業者を用いた評価実験によりその有効性を検証した.
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2015年04月 -2018年03月 
    代表者 : 櫻井 祐子; 横尾 真; 篠田 正人; 松田 昌史; 小山 聡
     
    クラウドソーシングは,計算機と人間の知を組み合わせることで問題解決を図るヒューマンコンピュテーションを実現するプラットフォームである.クラウドソーシングでは,ワーカの多様性を考慮したメカニズム設計を行うことが,望ましい結果を得るために重要である.本研究では,人間の実行可能性を重視することで,メカニズム設計理論をヒューマンセントリックな観点で再構築を行った.具体的には,(1)ワーカのコミュニケーションの問題,(2)ワーカの能力推定の問題,(3)ワーカらのチーム編成の問題を主に研究を行い,社会心理学,機械学習,マルチエージェントシステムの技術を融合し,様々なメカニズムやアルゴリズムを開発した.
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2012年04月 -2016年03月 
    代表者 : 小山 聡
     
    文章に表現されている感情を推定することは、文章の音声自動読み上げや感情教育など、さまざまなアプリケーションの基礎となる技術である。本研究では特に、物語文中の登場人物の発言に表現される感情を推定する研究に取り組んだ。感情ラベル間の依存関係、物語全体および個々の登場人物の感情の傾向や文脈情報を考慮することで、クラウドソーシングで得られたラベルから高い精度で感情を推定することが可能となった。さらに、異なる感情モデル間の互換性を実現するアルゴリズムの開発を行った。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2009年 -2010年 
    代表者 : 小山 聡
     
    Webから人物や組織などのオブジェクト単位で情報を検索できるオブジェクトレベル検索エンジン実現のための重要な技術的課題の一つとして,オブジェクトの時間変化への対応がある.本研究では,時間変化するオブジェクトの同一性判定問題を時間的に離れたデータ間の関係を予測する時間横断的リンク予測問題として定式化し,機械学習を用いて精度の良い予測を実現する方法の開発などを行った.
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2006年 -2010年 
    代表者 : 田中 克己; チャットウィチェンチャイ ソムチャイ; 田島 敬史; 小山 聡; 中村 聡史; 手塚 太郎; ヤトフト アダム; 大島 裕明
     
    ウエブからの同位語等の概念知識の抽出,ウエブ検索クエリの意図推定・自動質問修正,ウエブ情報の信憑性分析,ユーザインタラクションやウエブ1.0情報とウエブ2.0情報の相互補完による検索精度改善に関する技術開発を行った.
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2007年 -2008年 
    代表者 : 小山 聡
     
    実世界に存在するオブジェクトに関する多くの情報は,時間に関連付けられる場合が多い.例えば,人物の行動や発言,企業の製品発表などのイベントには,そのイベントが発生した時点がある.また,検索を行うユーザの側にとっても,それがいつの時点での情報なのかを確認することは重要であり,履歴の形で情報を整理してユーザに呈示することで,閲覧の支援が可能になると考えている.そこで,Webページから,履歴情報を日付とイベントの組の形で抽出をし,抽出結果を年表のように時系列で呈示する方式を研究した.
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2004年 -2006年 
    代表者 : 小山 聡
     
    オブジェクト識別は,文書集合等に現れる人名や店舗名などが実世界の同じオブジェクトを指しているか否かを判別する問題であり,通常,対象の名前を含む文書を,それらの間の類似度や距離に基づいてクラスタリングすることで解決される.しかしながら,目的に合致した適切な類似度や距離を用いなければ,望ましいクラスタリング結果を得ることはできない.従来,人手でラベル付けされた例題から,類似度や距離を学習させる研究が行われてきたが,人的なコストが掛かるという問題があった.我々は,オブジェクト識別を行う際にクラスタリングで用いる距離を,人間の教師を必要とせずに学習させる手法を提案した.提案手法は,別名の別オブジェクトへの対応と名前の恣意性という2つの仮定に基づいている.これらの2つの仮定が成り立てば,異なる名前を含むデータ対をリンク不可な例題として学習した距離を,同じ名前を持つデータのオブジェクト識別に用いることができるため,訓練集合の人手での作成が不要になる.リンク不可なデータ対のみを例題として用いる距離の学習は,凸2次計画問題として定式化され,一般の距離行列を学習する際に必要な半正定値計画問題よりも,高速に解くことが可能である.また,オブジェクトに関する情報を複数ページから抽出し統合する例として,対象となる人物の経歴情報をWeb検索結果中から収集する手法の研究を行った.さらに,複数Webページの検索閲覧を支援するために,ユーザが与えた語と兄弟関係にある語を発見する手法,およびユーザが与えたWebページの話題と兄弟カテゴリに属する話題を記述したページを発見する手法を開発した.そして,目的のオブジェクトに関するページを効率良く取得するため,話題語をノードとするグラフでWebページ集合を表現し,グラフを操作させることでユーザからのフィードバックを得るユーザインタフェースの研究を行った.
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2004年 -2005年 
    代表者 : 田中 克己; 小山 聡; 田中 浩也
     
    本研究では,WebデータやWeb利用者のデータ検索行動に内在する意味構造を発見し,これに基づき,高度なWeb情報検索サービスを実現するための方式を開発することを目的としている.特に,Webに関する次のような意味構造の発見に焦点をあて,これらの意味構造に基づく新しいWeb情報検索サービスを実現するための基盤技術および方式開発を行った. (1)話題構造・詳細度構造に基づく補完型情報検索方式の開発 Webコンテンツに内在する話題構造等を自動抽出し、これを用いて対象となるWebコンテンツの内容を補完する補完情報検索方式の開発を行った。また、補完情報検索を行う際に必要となるオブジェクトの同定アルゴリズムの開発を行った。 (2)閲覧履歴や個人コンテンツからのユーザ選好情報の自動抽出に基づくWeb検索の個人化方式の開発 閲覧履歴からユーザの相対的な選好情報を抽出したり、個人コンテンツからユーザ独自の概念体系を抽出し、これに基づき、Web情報検索を個人適応化させる方式を開発した。 (3)Blog情報からの重要Blogger発見とユーザ体験・評価情報の抽出 Blogスレッドの構造・内容分析により影響力の高いBlogエントリを発見したり、街Blog情報からユーザの体験・評判情報の自動抽出を行う方式を開発した。 (4)Web周辺空間の視覚化とナビゲーション支援方式の研究 閲覧中のWebコンテンツに対する意味的な周辺情報を自動抽出しこれを視覚化することでユーザのナビゲーション支援を行う方式を開発した。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2002年 -2004年 
    代表者 : 田中 克己; 角谷 和俊; 小山 聡; 田中 浩也
     
    本研究は,モバイル端末上でコンテンツの検索や呈示を行うための新しいソフトウエア技術を開発し、高度なモバイル・コンテンツアクセス・サービスの実現を目的とするもので、主に以下の項目に関して研究を行った。 (1)コンテンツの自律的提示方式の研究: 機器の操作説明情報やWeb検索エンジンの検索結果をモバイル端末で取得し,これをCGアニメーションと合成音声によって受動的に視聴できるシステムを開発した。また、移動体のビデオ動画像のマルチモーダル検索を行うために、移動体の移動軌跡をスケッチで入力する方式を開発した。 (2)クロスメディア・メタサーチエンジンの研究: 携帯型端末で単純なキーワード入力により、多様なメディアのコンテンツを横断的に検索するために、質問緩和法という方式を開発した。これは、テキスト検索エンジンと,画像検索エンジンを同時使用して検索収集するメタサーチエンジンであり、評価実験の結果、適合率の低下を20%前後にとどめながら再現率を3倍程度向上できることが確かめられた。 (3)対話からの話題構造の発見とこれに基づくモバイル検索: 携帯電話でのチャットやメール等の対話情報から話題構造を抽出し、これをもとにWeb検索するシステムを開発した。また、Blog情報を解析してWeb検索におけるトラスト値を算出する方式や、閲覧中のWebページに関連するBlog情報を受動的に視聴できるシステムを開発した。 (4)モバイル放送のためのコンテンツの動的複合化方式: ストリームコンテンツの動的な複合化が行えるスクリプト言語MetaSMILを開発した。この言語の特徴は、従来のSMILに比べて、スクリプト中に検索質問を埋め込めたり、複合化に関する意味制約を表現できる点である。さらに、Web文書も画像とみなして、デジカメ画像や携帯電話画像と既存のWebページを自動的に関連づけて表示する方式を開発した。 (5)Webコンテンツの自律的な検索・表示機構に関する研究: 実空間に配置された複数の表示デバイス上に表示されたWebコンテンツ群が、自律的かつ互いに連携をとりながら自身を表示するとともに、ユーザの身体的操作に応じて自動検索できるようにする方式を開発した。
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2003年 -2003年 
    代表者 : 小山 聡
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2002年 -2003年 
    代表者 : 角谷 和俊; 田中 浩也; 小山 聡; 田中 克己
     
    本研究では,まず,ストリーム型の放送番組コンテンツのWebページへの動的統合システムの開発に取り組んだ.本システムは,ユーザがWebページの任意の個所を選択することにより,その内容を適切な長さのビデオによって補強するものである.また,Webページの意味構造を利用し,これに対してクエリを記述することによって,統合のためのテンプレートを実現する枠組を構築した.また,マルチメディア統合コンテンツを構築するためのスクリプトと,統合に用いられる素材に対して利用条件を表現するメターデータ記述を開発した.これらの記述によって,権利問題を解決しながら,コンテンツの動的な統合を実現する機構を構築した. 次に,放送コンテンツと関連情報の複合化とパーソナル視聴方式として,放送コンテンツにおいて,映像と付帯するデータ(字幕テキスト)から,多重の詳細を持つWebコンテンツを自動的に生成し,詳細度をズーム・インタフェースで変更しながら個人的に視聴することが可能な手法に由り組んだ.本手法では,字幕データが付与された映像から,時間データを基に映像をクラスタリングし,映像サムネイルと付帯するテキストを抽出し,ユーザの閲覧時にWebページを動的に生成することが可能である.さらに,シーンの検索には,生成されたテキストを用いてシーンの特定を行い,関連情報と共に放送コンテンツを閲覧する機能を構築した.一方,Webページと映像の関連抽出や検索エンジンの統合利用についても検討を行った.
  • 日本学術振興会:科学研究費助成事業
    研究期間 : 2002年 -2002年 
    代表者 : 田中 克己; 小山 聡; 角谷 和俊
     
    本研究は,WebデータやWeb利用者のデータ検索行動に内在する意味構造を発見し,これに基づいて,高度なWeb情報検索サービスを実現するための方式を開発することを目的としている.本研究で注目をしているWebの意味構造は,(1)WebデータやWeb利用者の探索行為に関わる「文脈情報」,(2)Webデータ間の「差異情報」,(3)Webデータに内在する「話題構造」,(4)Webデータの「ローカル度」(地域関連度やアクセスの地域限定度)などであり,これらの意味構造の発見・推定の方法を研究している.さらに,得られた意味構造情報を用いて,さまざまなコンテンツ検索サービスへの応用方式についても研究を行っている. 具体的な研究成果は以下の通りである.(1)Webからの画像検索において、画像の文脈情報(画像の周囲の情報やそのWebページを指すリンク元ページ情報など)を視覚化して表示することで検索支援を行う方式や,文脈情報から画像を検索する方式を提案した.さらに,利用者の選択・非選択ページを記録し,この情報をメタデータとして反映させた新しいブックマーキング方式を開発した.(2)クラスタリングされた検索画像群に対する利用者の選択画像・非選択画像の間の差異情報を増幅させた新しい適合フィードバック方式や,複数のWebデータの差異を同時に見ることができる新しいブラウザなどの開発を行った.(3)利用者が入力した質問キーワード群からそのキーワードが表題・本文のいずれに適合しているかを判定し自動的に質問変換を行うことで,話題構造によるWeb検索を行える検索方式を開発した.さらに,TV番組の字幕データから話題構造を推定しWebによる情報補完が行える新しいブラウザも開発した.(4)Webページ中に出現する地理用語の頻度・密度・緯度経度情報からWebページの地域関連度を求める方式と,他のWebページ群との比較に基づくアクセスの地域限定度の推定を行う方式を開発し,これに基づいてローカル度によるWeb情報フィルタリングを行うシステムを開発した.

その他のリンク

researchmap



Copyright © MEDIA FUSION Co.,Ltd. All rights reserved.