研究内容
主に,画像上でのパターン認識やコンピュータ—ビジョン(CV) に関する研究を行っています.
最近は以下のようなテーマを進めています.
主に,画像上でのパターン認識やコンピュータ—ビジョン(CV) に関する研究を行っています.
最近は以下のようなテーマを進めています.
犯罪捜査や写真の自動整理などでの顔認識の利用を考慮して,
大量の顔画像の中から特定の人物の顔画像を認識する手法を提案した.
多くの従来の顔認識手法では,大域的特徴量をSVM などの機械学習を用いて学習した識別器を
用いて認識を行っている.
このような手法では,計算時間が考慮されていないため,データベースの規模が大きくなると
計算時間が爆発的に増えるため,大規模なデータベースに対しては現実的な手法ではない.
提案手法では,特徴量の照合に計算が単純でかつ近似計算が可能な最近傍探索を用いることで
高速な認識を実現し,
複数の局所特徴量の照合結果を投票で統合することで,認識率の向上を図った.
実験の結果,提案手法では300 万顔画像データベースに対して,
計算時間257 ms, 1000位累積認識率96.9% で認識を実現した.
人間の活動の様子をデジタルデータとして記録するライフログが認知され,急速に広まっている.人間の活動のうち,読書は知的活動の中心であり,重要な行動の1つであるが,読書行動をデジタルデータとして記録する技術は確立されていない.そこで現在,我々の研究グループでは,人の読書行動を自動的に記録するReading-Life Log を提案し,読書行動をデジタルデータとして自動的に記録することを目標に研究を行っている.その一環として,我々は,いつ読書を行っているか,また,何を読んでいるかを検出することに焦点を当て,自動的に読書行動を検出し,文書カテゴリを識別する手法を提案した.
提案手法では,モバイルアイトラッカから得られる視線の動きをもとに読書行動を検出し,一人称視点画像から視線情報をもとに文書領域画像を取り出し,画像特徴量を用いて,読んでいる文章を6種類のカテゴリ(教科書,論文,新聞,雑誌,小説.マンガ)に分類した.読書行動や文書カテゴリ分類にはmulticlass SVMを用いた.
実験の結果,読書行動検出精度は90.5%,文書カテゴリの識別精度は85%となった.
現在,農業では,従事者の勘と経験により,生育方法,育種などが行われているが,異常気象などの急激な変化には対応が困難となっている.そこで,植物の生育を網羅的に調査するフェノタイピングを行うことで,植物の環境応答特性を知り,最適な作物の栽培方法を模索することが解決策として挙げられている.フェノタイピングでは,植物の形状を大量に計測する必要があるが,作業は現在手動で行われており,自動化がされていない.そこで,本研究では,植物の形状のデータを自動的に計測することを目的とし,高精度な植物の3次元形状復元を提案した.
提案手法では,従来の3次元復元手法であるStructure from Motion で復元不可能な部分を補うため,画像の色情報に基づいて3次元位置を推定した.
実験の結果,従来手法で失敗していた葉の中央部分の復元に成功した.
大阪では,ブドウの栽培が盛んであるが,農業従事者の高齢化が進んでおり,新規参入者の育成が課題となっている. しかし,ブドウ栽培は他の果物と比較して作業の種類が多い上,時間がかかるため,ブドウ栽培技術取得は 新規参入者の大きな負荷となっている. そこで,我々はブドウ栽培の作業のうち,摘房(房を間引いてブドウの品質を安定させる作業),摘粒(ブドウの実を間引いて房の整形をする作業)に注目し,これらを画像処理を用いて支援するシステムの開発を行っている. 摘房作業では,ブドウ畑での房の数を自動的に数え,房の密度を提示することで,作業の効率化を図る. 摘粒作業では,ブドウの画像から3次元構造を取得し,その中から間引く実を自動的に決定し提示することで, 作業の支援をする. 最終的には,ウェアラブル端末にこれらの支援情報を提示するシステムを開発する予定である.