本テキストは,JSAI2018のサイト(https://confit.atlas.jp/guide/event/jsai2018/top)において,「深層学習」で講演検索(タイトル,キーワード,アブストラクトのいずれかでマッチ)を行った結果の発表タイトルとアブストラクトを抽出したものとなっています. なお一部の,特別企画等は検索結果から除いています.また,アブストラクト中の,空行,半角英数字の前後や文頭などにおける英単語同士を区切るため以外の半角スペース,文の途中の改行は削除するとともに,すべての句読点は一括変換により全角の「,」「.」に統一しています.小数点は半角ピリオドにしています. スナリバラフト 3D仮想環境Minecraftにおける深層強化学習への視線方向の影響. 近年,深層強化学習が人工知能研究者の関心を集めている.深層強化学習とは深層学習と強化学習を組み合わせた手法であり,強化学習で用いる関数を深層学習で近似することで,3Dビデオゲームのピクセルのような複雑な環境を用いて学習を行うことが可能となった.しかし,このような学習はときより,少しの入力されたピクセルの差によりエージェントの行動が全く異なるものとなる,といったような問題に直面することがある.本研究ではこのような問題に対して,3D仮想空間Minecraft内のエージェントの視野の方向に着目して深層強化学習に与える影響を分析した. スナリバラフト 多人数追跡のための分散深層学習による高精度な検出にむけて. 近年,ImageNetのデータセットに対する一般画像認識を対象に,大規模並列分散環境下での分散深層学習による高速化の取り組みが進んでいる.一般に,分散深層学習を実問題に適用するためには,ドメインに特化した学習モデルを生成する必要がある.しかし,ImageNet以外のデータセットを対象とし分散深層学習を用いた場合,学習率やバッチサイズなどのハイパーパラメタや汎化性能,最適化アルゴリズム,並列化性能などを評価した事例は多くはない.我々は,ドメインに特化したデータセットに対して,YOLOの学習モデルを分散深層学習で行い,高精度な物体検出や物体追跡を目指している.本稿では,この取り組みの概要と多人数追跡動画を対象とした初期の評価について報告する. スナリバラフト 離散および連続的動作空間における深層強化学習を用いたスマートアネルギーシステムの最適化. マートグリッドにおけるエネルギー最適化は,State of art深層学習や深層強化学習に代表されるエージェントベースの機械学習手法に徐々に移行している.特に,強化学習手法をベースにした深層ニューラルネットワークが出現し,スマートグリッドへの応用に人気を集めている.本研究では,離散的動作空間および連続的動作空間の両方に対応するようデザインされた2つの深層強化学習アルゴリズムの応用を試みた.これらのアルゴリズムは,スマートグリッドの最適化を目的に,Simscape Power SystemsTM(Matlab / SimulinkTM Environment)を構築することで厳密な物理モデルによく組み込まれた.結果として,エージェントは訓練データにおけるエネルギーの需要と供給の機能を非常 スナリバラフト 転移学習による膀胱癌の内視鏡診断の客観的評価. 本稿は,学習済み深層学習モデルを用いた転移学習による膀胱がんの内視鏡診断の客観的評価手法を提案する.提案手法では,大量の一般画像で学習した深層学習モデルを特徴抽出器として複雑な内視鏡画像の特徴を捉え,後段の分類器のみを学習することで,比較的少ない膀胱内視鏡画像の学習でも深層学習モデルを活用した病変検出を実現する.本稿では,提案手法の有効性を検証するため,実際の膀胱内視鏡画像を用いた実験を行った.実験の結果,見分けることが難しい正常と平坦病変の2クラス分類において,感度95.7%,特異度93.3%を達成し,提案手法による膀胱癌の内視鏡診断の客観的評価の有効性を示した. スナリバラフト 異被験者間の脳活動データ相互変換による擬似データ作成. 近年,脳神経科学分野において脳神経活動を定量的に理解する研究が盛んに行われている.また,近年の深層学習の成果を取り入れて脳活動データを解読する研究も報告されている.そのような深層学習を用いて脳活動データを取り扱う際,学習のために大量のデータが必要である.一方,functional Magnetic Resonnance Imaging (fMRI)を用いた脳活動データは機械学習のために使用できるデータ数が不足するといった問題が生じる.これらの背景を踏まえて,本研究では異なる被験者の脳活動データ同士の対応関係を学習し一つの形に統一することで,データを擬似的に増やし,それを実際に深層学習に使用できるようにすることを目指す. スナリバラフト LSTMを用いた俳句自動生成器の開発. 深層学習を使用した芸術の作成が近年注目を集めている. また,日本で古くから親しまれている芸術として俳句がある. そこで,俳句を作成する方法として一般的な「モチーフから俳句を作る」ということを深層学習を使用して行うことで,芸術作成としての深層学習の有用性を示す. まず,我々は大量の過去の俳句に基づいてLSTMを訓練し,LSTMに文字列を生成させる. 2つめに,生成された文字列から俳句としての条件を満たすものを抽出し,モチーフ画像に適合するかどうかの評価値を算出する. 評価値が高ければ,生成された俳句がモチーフ画像に適合しているとみなす. この過程で,LSTMが俳句としてのルールを学習できているかを確認するための実験を行った. スナリバラフト 高次元データの認識から生まれる生命性についての深層学習アプローチ. 生物は高次元で複雑な生のデータを認識する.近年発展した深層学習はそのような複雑なデータの認識を可能とする.本論文では,深層学習を用いて,従来のミニマルモデルでは扱われ難かった高次元のデータの認識が生み出す生命性を考える.我々は視覚と運動の統合学習を通して空間認識能力を発達する階層型リカレントニューラルネットワーク(階層型RNN)モデルについて研究を行ってきた.階層型RNNはシミュレーション実験において,視覚と運動の主観的な経験のみから空間の客観的な地図である認知地図とみなせる内部モデルを獲得した.さらに,現実のヒトによって取得する視覚と運動の系列を用いた場合にも空間認識能力を獲得することが示された.これらの結果は,深層学習モデルを用いて現実の生命における認識を理解できる可能性を示唆している. スナリバラフト 経営情報キュレーションのための事前学習付き重要文ランク学習. 効率的に重要度の高い情報を集め,経営活動における意思決定を支援するために,ユーザのフィードバックから,特定のユーザ群が重要と考える情報をランキングできる手法を開発した.本研究では,ドメイン知識へ依存することなく意味情報の抽出とランキングをend-to-endで学習できる深層学習を用いることとし,データが大量に必要であるという深層学習の欠点を補うために事前学習を用いることを提案する.交差検証に基づく定量的な実験において,非深層学習のベースラインを上回った.実験の妥当性を評価するためにA/Bテストを行った.提案手法は過半数の試行において,最も良いと評価され,経営活動のための重要文キュレーションにおいて提案手法が有効であることが示唆された. スナリバラフト 経験データ重み付けによるDeep Q Networkの高速化. Deep Q Network(DQN)は行動価値関数をディープニューラルネットワークによって近似するものであり,人間を上回る行動選択能力を獲得するに至っている.しかし,DQNは学習速度が極めて遅い.DQNはエージェントが観測したデータ郡(経験データ)をメモリ内に保存し,そこから等確率でランダムにサンプリングした経験データを用いて学習を進めていくが,経験データは出現率が異なるため,出現率の高い経験データに対する学習は冗長に行われ,低いものに対する学習はなかなか進まない.そこで,出現率の低い経験データを重要な経験データとして扱い,サンプリングされる確率を操作することで学習効率を高めることができると考えられる.Atari2600のPongで実験した結果,DQNの学習速度を改善することができた. スナリバラフト 軌道学習における試行回数削減のための強化学習手法. 近年,ロボットの自律的動作の実現を目指して深層強化学習の研究が多くなされている.深層強化学習では学習結果として十分な性能を実現するまでに何千回,何万回といった非常に多くの回数の試行を必要とする.しかしながら,実環境の学習では人の手を必要とすることが多く,何千回という試行回数を行うことは非現実的である.そこで本研究では,事前に人がタスクに関する知識を与えることで効率的な探索を行い,学習データベースを作成する.そしてそのデータベースを使用してミニバッチ学習を行うことで比較的少ない試行回数による学習を実現する.本提案手法を物流倉庫内におけるピッキング作業の学習に適応し,その結果を他の手法と比較することで本提案手法の有用性を示す. スナリバラフト 事前知識を活用したMemory Reinforcement Learningによる行動獲得. 深層強化学習による行動の獲得には大量の学習が必要であり,安定した行動を獲得することが難しい.そこで本研究では,深層強化学習において安定した行動を効率的に獲得するためのMemory Reinforcement Learningを提案する.提案手法では,事前に獲得した安定的な行動遷移をexperience replayのreplay bufferに保存した状態で学習を開始することで,学習の初期段階から安定した行動を選択し,効率的な学習を可能とする.自動運転車両の車線変更を行うシミュレータ環境を用いた実験にて,提案手法を用いることで安定した動作を効率的に学習可能であることを示す. スナリバラフト 満足化を通じた最適な自律的探索. 深層学習はその優れた関数近似能力により巨大な行動状態空間での強化学習を可能にしたが,探索と知識利用のトレードオフはより深刻になる.それに対し,乱数を利用した探索によるトレードオフに対処するためのヒューリスティックがいくつか提案されている.しかし確率的探索手法はパラメータ調整を困難にし,深層強化学習アルゴリズムの性能における巨大な分散の問題を増幅する.そこで我々は人間の不確実性を評価に対する意思決定傾向の側面を有する認知的満足価値関数(RS)に基づく決定論的行動選択アルゴリズムに着目する.本研究では新たに満足化基準に対する潜在的な選択比率との関係を明らかにし,最適な探索を可能にする方法を提案する.提案アルゴリズムは多腕バンディット問題において最適な探索性能を示し,従来とは異なる視点での強化学習アルゴリズムのクラスに繋がる示唆を得た. スナリバラフト 深層学習法による源氏絵の流派推定. 源氏絵とは,『源氏物語』を題材とした絵画の総称である.源氏絵の絵師には土佐派をはじめ狩野派,岩佐派,など多数の流派があり,各流派独自の個性がある.これまでに見つかった作品にはどの流派の絵師が描いたかわからないものがあり,美術史の専門家たち中でも意見が分かれている.そのため新たな知見から流派を判断する手法が望まれる.近年,深層学習の一種である畳み込みニューラルネットワークの画像分類能力の向上は著しく,一部の分野では人間よりも高いという報告もある.深層学習では特徴量がデータから学習されるため,これまで人間が発見していない特徴量に基づく分類をすることが期待できる.本稿では,深層学習による物体検出手法を用いて顔を自動認識し,畳み込みニューラルネットワークにより流派を推定する.5分割交叉検証を行った結果,96.5%の精度で分類することに成功した. スナリバラフト キャラクター顔特徴量の個別漫画への適応手法. 本研究では個別の漫画でのキャラクターの分類を目的とする.キャラクターの顔とコマのバウンディングボックスが与えられているという条件で,深層距離学習によって個別の漫画への適応した特徴量を作成してクラスタリングを行う手法を提案する.深層距離学習に必要な正ペアと負ペアを,漫画特有の性質である同じキャラクターは近くのページやコマに登場しやすく,同一のコマに現れるキャラクターはほぼ異なるという性質を考慮して推測する.個別の漫画に適応したことによりクラスタリングが改善した. スナリバラフト 音声データを用いたうつ病重症度の深層学習解析. 精神疾患の診断は現在,問診に基づく医師の主観的判断によって行われている.このような現在の診断方法は医師の経験に強く依存するため,正確な診断を行うための客観的な診断方法を開発する必要があると言われている.したがって我々の目標は,デバイスによって記録されたデータからうつ病患者の重症度を客観的に計算する深層学習手法を構築することである. 本研究では,うつ病患者と健常者を音声データで分類する深層学習プログラムを開発する. スナリバラフト 3分岐型畳み込みニューラルネットワークによる4コマ漫画の順序識別. 近年,マンガを工学的に解析しようと試みるコミック工学が機械学習の急速な発展を背景として注目されている.本研究では,4コマ漫画に着目し,4コマ漫画の順序構造の理解に深層畳み込みニューラルネットワーク(Deep Convolutional Neural Network: DCNN)を適用した.今回,4コマの理解のために3分岐型DCNNモデルを提案する.この3分岐型DCNNのハイパーパラメータは進化型深層学習(evolutionary deep learning: evoDL)によって獲得する.実際の4コマ漫画の画像データを用いた数値実験によって,提案手法の有効性を示した. スナリバラフト 畳込みニューラルネットワークとSVMを用いたびまん性肺疾患の陰影識別. CAD(Computer Aided Diagnosis)の研究は医師にセカンド・オピニオンを与えるために行われ,自動特徴抽出能力を備えた深層学習を用いた.しかし,深層学習は,高性能を達成するためにラベル付きデータを多数必要とします.本論文では,機械学習を用いたびまん性肺疾患の分類問題を扱っており,ラベル付き訓練データの数を減らして高い分類精度を達成することを目指している.提案手法は,最初にSelective Searchを使用して肺CT画像から関心領域(ROI)画像を抽出する.そして,VGG16とSVMとを組み合わせて分類を行う.VGG16は,畳込みニューラルネットワーク構造の1つであり,特徴抽出器として使用し,分類はSVMで行う.実験結果から,提案法はVGG16単独よりも高い分類精度を示した. スナリバラフト 半教師ありマルチモーダル深層生成モデルにおける共有表現の有効性と単一モダリティ入力への拡張. 近年のマルチモーダル学習は,深層ニューラルネットワークが用いられることが多い.通常,ネットワークの訓練のために大量のラベルありデータ集合が必要だが,ラベル情報の付与には人的コストがかかってしまう.したがって,マルチモーダルデータにおける半教師あり学習が重要となる.これらの手法の中でも,近年深層生成モデルを用いたマルチモーダル半教師あり学習が提案されている.本研究では,まずこれらの手法を比較し,特に決定論的な対応関係がない異なるモダリティを入力とした場合,共有表現に対応する潜在変数を持つSS-HMVAEが高い性能となることを確認する.次に単一モダリティからラベルを予測するために,SS-HMVAEを拡張したモデルであるSS-HMVAE-klを提案する.この手法によって,従来のモデルと比較して,単一モダリティを入力とした場合の性能が大幅に向上することを確認した. スナリバラフト 効率的な知識獲得予測に向けた知識の表現方法に関する分析. 近年,オンライン教育サービスの発展に伴い,知識獲得予測の研究が活発化している.知識獲得予測は,生徒の学習行動ログに基づいて,各生徒が知識をどの程度習熟しているかを予測するものであり,深層学習を活用することで効果的な予測が可能になることが報告されている.こうした深層学習を用いた知識獲得予測の手法の発展は,これまで所与とされてきた「知識」の定義自体も見直す必要性を示唆するものでもある.近年では,知識獲得予測を行う上で効率的な知識タグ自体を,生徒の学習行動から学習する手法が提案されており,機械の予測に基づいた学習内容の個人最適化が普及していく中で,機械にとってより予測しやすい知識表現を設計することの重要性が高まっている.本研究では,知識獲得の予測性を最大化するように学習された知識タグの性質を分析することで,機械にとって予測しやすい知識構造についての分析を行う.実験の結果,学習されたタグは,既存のタグに比べて生徒の問題回答の情報を効率的に表現する構造を獲得していることが確認され,また,既存のタグと組み合わせることでより高い予測性能を発揮する,相互補完的な性質を有することが検証された. スナリバラフト 活性固定化による深層学習モデルの視覚的説明の鮮明化. 深層学習モデルはその複雑な内部のネットワーク構造がゆえに,モデルがどのような認識機構に基づいて画像認識を行っているかを人間がうかがい知ることはできない.このモデルのブラックボックス性を緩和して説明性を高めるために,特に画像認識の分野において視覚的な説明性を向上させる方法の研究が進めらている.これら視覚的な説明では,深層学習モデルが画像中のどの領域を根拠に認識を行なっているか,その認識対象を特定してハイライトする.本研究では鮮明なハイライトを得るための前処理方法として活性固定化を提案する.活性固定化ではまず前処理として深層学習モデルの認識に寄与している主要な構造だけを残して,残りの非主要部を枝刈りする.その後で既存の視覚的説明法でハイライトを生成する.このように前処理として活性固定化によりモデルの非主要部を枝刈りすることで,非主要部に由来するノイズを除去した鮮明なハイライトを生成できる. スナリバラフト 深層学習抽出特徴量から生成した擬似特徴量を用いた不均衡データ多クラス画像分類. 現実のデータでは,少量のデータしかないクラスの識別率が極端に低くなってしまう問題があることが知られており,不均衡データと呼ばれている.少数データのクラスに量を合せて多数データのクラスからランダムに抽出するダウンサンプリングという方法がある.しかし,少数データの数が非常に少ない場合学習データの総量も少なくなり深層学習に適さない問題がある.本研究では,深層学習ネットワークの最終層近くから抽出した特徴量から擬似特徴量を作ることで,元々少量しかなかったクラスのデータ量を増強する方法を提案し,多クラス画像分類問題でその有効性について既存手法との比較検討を行った. スナリバラフト 深層学習による質感文字生成. 本研究では文字のフォントの自動生成,自動変換のタスクに取り組んでいる. 従来のフォント生成のタスクでは文字をいくつかのストロークから成り立つものとしモデル化を行い作成する手法が取られてきた. それに対して,本研究では深層学習により,画像中のフォント画像ないしパターン画像からストロークに相当する特徴を自動で抽出し, 変換元のフォントから任意のデザインパターンへの変換に挑戦している. この仕組みにより手書き文字のような個人ごとのオリジナルフォントの作成が用意にできるようになる. 実験ではケチャップ文字を始めとしたユニークな質感パターン画像セットを作成し, 深層学習のクロスドメイン学習による手法とNeural Style Transferの手法とを組み合わせ,生成結果の可読性を改善した. スナリバラフト 深層強化学習による推薦システム. 近年,インターネット上でユーザに対して店舗の紹介を行うサービスが増えてきている.各サービスでは同時に,ユーザの嗜好に合った店舗を表示させる分析が幅広く行われてきている.推薦の分野ではユーザのクリック情報が十分に存在する時には協調フィルタリングが高い性能を誇る.一般的にユーザ×アイテムの行列を作成した際データスパースの問題が発生するので新規ユーザに対応することが難しい.また十分にデータが得られなかった場合,バンディットアルゴリズムなどを応用しているケースが見られる.バンディットアルゴリズムは各アームを十分に試行してそれぞれから報酬を得ることで学習を進めていくためアイテム数が多くなった場合に全てを学習するのは実質的に不可能である.新たなユーザが出てきた時に十分にデータを集める必要性は協調フィルタリングと同様の問題がある.上記の問題を解決すべく本稿では強化学習の価値関数の更新に多層ニューラルネットを用いた深層強化学習による推薦システムの提案を行う. スナリバラフト 深層学習を用いたユーザ離脱予測. サブスクリプション方式のサービスを採用している企業が増えつつある昨今,ユーザ離脱予測はより重要な課題となっている.既存研究では既に多くの機械学習モデルを用いた研究が行われているが,ユーザ離脱予測は時系列データと非時系列データなどの多様なデータ組み合わせて学習させねばならず,それらを上手く組み合わせた学習モデルは十分に研究されていない. 一方で,深層学習の技術は依然発達しており,その特徴としては様々なデータとモデルをEnd-to-Endで学習できることが挙げられる. 本研究では,ロボアドバイザーのサービスを運営するウェルスナビ株式会社のデータを用い,深層学習を用いたユーザ離脱予測モデルを提案する.具体的には時系列データや非時系列データを一つのモデルで学習させる手法を提案する. 実験ではベンチマークとなる既存研究の分類器の精度を上回る結果を得たことで,本手法の有効性が実証された. スナリバラフト 農作物病害画像診断に向けたData Augmentationの評価. 近年,深層学習による農作物病害画像診断が提案されている.大量のデータ取得が課題の一つで,容易に解決できない.我々は少量の農作物画像データに対し,学習用データに変形や加工したものを加え精度向上を目指すData Augmentation (DA)を試みてきた.これまでの実験で多くの条件で精度向上したが,精度低下する手法なども確認している.DAを実用し正答率を向上させるためにはこの原因を明らかにする必要がある.深層学習では,検証用データの集合に類似したデータが学習用データの集合に存在するほど正答率の向上が考えられる.我々は学習用データと検証用データの集合間の距離を測定し,距離が近くなれば正答率が向上する良いデータであり,その逆は正答率を低下させる悪いデータであると考えた.この相関関係が明らかにできた場合,DAで拡張した学習用データの良し悪しの判断指標になると考えられる.我々は二つの画像データ集合の距離を測定することが可能であるFrechet Inception Distance (FID)を用いて測定できると考えている. 本研究の目的は,FIDの距離と正答率の相関関係を明らかにすることである. スナリバラフト 聴神経の計算論再考:教師なし学習か課題最適化か?. 聴神経フィルタ特性を理解するための計算モデルとして,自然音の教師なし学習モデルが提案されてきた.本研究では,より自然な音として自然環境下における音の変調を考慮に入れると,教師なし学習よりも音響課題に最適化された深層ニューラルネットワークがより良いモデルであることを示す. スナリバラフト 類似度学習を用いた敵対的訓練による特徴表現の検閲. 深層学習は多様なタスクで予測精度を向上させることが報告されている一方,実世界への適用を考えると,認識精度だけでなくさまざまな社会的な制約が問題になる場合がある.例えば社会システムの一部として機械学習を利用する場合は,人種や性別など,公平性に問題があるような情報を含む表現を判断に利用しないことが求められる.しかし,深層学習は最適化の結果ブラックボックスに表現を獲得するだけであり,獲得した表現がどのような情報を持つかを予期することは容易ではない.本稿では,学習される特徴量が不適切な情報を持たないように明示的な制約を加える方法として,2つのサンプルに紐付いた特徴表現のペア同じグループに属するかを判別する類似度識別器を用いた敵対的訓練の枠組み(類似度学習を用いた敵対的訓練)を提案する.また,提案した枠組みに基づく具体的な方法として,Similarity Confusion Training(SCL)とLearned Similarity Maximization(LSM)の2つを提案し,ウェアラブルセンサを用いた行動認識におけるユーザ匿名化タスクでその有効性を確認する. スナリバラフト 深層学習を用いた新聞記事分析による市場動向予測における予測精度の改善. 本論文では,深層学習を用いて新聞記事を分析し,市場動向を予測する.我々は,これまでに,深層学習を用いた時系列テキスト分析に基づいて市場動向を予測する手法を提案した.この手法は,2008年から2014年の間に日本経済新聞からTOPIXを予測する上ではうまく機能したが,2015年以降では予測精度が低下してしまった.そこで本論文では,2015年以降の予測精度を向上させるために訓練データの期間を短縮することを提案する.訓練データの期間を過去3年間にした結果,予測精度は55.1%から67.3%に12.2%改善された. スナリバラフト 外部光で動作するDNN向けニューロン素子の初期検討. IoTデバイスの適用環境に対する物理的な親和性を高めるために,深層学習等の知的処理の演算アーキテクチャを素材から見直す試みを進めている.その一例として,本稿では光導波路で演算ネットワークを構成し深層ニューラルネットの演算を光信号で実行する方式を提案する.提案する演算機アーキテクチャは,外部から取り込んだ光で直接駆動されるように設計された積和演算素子とその出力を非線形変換する非線形関数演算素子,そして,それら演算素子を光増幅機を使わずに多段に接続する機構からなり,推論を実行する全結合型DNN (Deep Neural Network)を構成することができる. スナリバラフト インバウンド観光マーケティングモデル「グリーンAIアカデミー」. 2016年夏のサンゴ大白化現象が生じて以降,宮古島の白化サンゴを2年にわたり観察した結果,完全白化状態から回復した健全なサンゴが多く確認できた.よって,今後増加するであろう白化影響を受けたサンゴ礁の回復評価を行う場合,白化が進行しているのか,回復しているのかの識別が必要になる.この課題を解決するため,高精度なサンゴ礁回復評価を目標にした深層学習フレームワーク(以降,グリーンAI)を導入することにした.この深層学習用の学習データとしては,過去2年100日間にわたる野外観察データ(写真動画:2Tb)を活用する.また,白化回復の正解ラベル設定は,筆者が担当しつつ,アノテーター養成のための「グリーンAIリテラシー育成プログラム」も多言語で作成する.外国人観光客に「グリーンAリテラシー」体験学習を提供し,宮古島のサンゴ礁保全に貢献する「グリーンファン」へと誘うインバウンド観光マーケティングを目指す. スナリバラフト 深層強化学習と言葉による離散化を用いたロボット制御への取組み. 近年,高齢化社会に伴うロボットの普及が広がりつつある.家庭内にロボットが入り込んだ際に人間がロボットに自然言語による指示を行い,ロボットが人間の言葉から新しい行動を自発的に学習してくれることが期待される.本研究ではロボットの動作を言葉で表現可能な動作の基本要素から構成される階層的な構造に離散化することによって深層強化学習を用いたロボットの動作を学習する効率的な手法を提案した スナリバラフト 金融レポート,およびマクロ経済指数による日銀センチメント指数の構築. 日銀の金融政策決定会合議事要旨に対して,生成モデルおよび深層学習を用いることで,日銀のマクロ経済や物価等に対するトピック別のセンチメントを指数化を行う. スナリバラフト 深層学習を用いた果実生育情報抽出Webアプリケーション. 本研究では,定点観測画像から果樹の生長把握を容易に行うアプリケーションを実現するために,深層学習を用いたリンゴ果実サイズの自動抽出と,その情報を用いた統計的情報の提示および,生長曲線の生成を行うアプリケーションを開発した.リンゴ果実の検出精度はF値72.4であり,果実の生長を把握する上で実用的な値だと考えらえる. スナリバラフト 深層学習を用いたTwitterユーザの性格推定. 近年,SNSが広く普及したことにより,ネットワークを通じて様々な人間と気軽に交流を行えるようになった.円滑な交流を行うためには,相手の性格を理解し,受け入れる必要がある.しかし,SNS上では文章のみのやり取りになるため,十分に理解することは容易ではない.そのため,文章の特徴から著者の性格を推定することができれば,その結果を元にして交流相手を理解することがより簡単となる.そこで本研究では,代表的なSNSのひとつである,Twitterユーザを対象として,ユーザがSNS上に投稿した文章集合から,ユーザの性格を深層学習を用いて推定した結果を利用者に提示するシステムを構築することを目的とする. 人間の性格を複数の構成要素から成るものとして,それぞれの要素について深層学習により分類ネットワークを構築し,推定システムを開発した.各要素の推定結果に対して,複数人の協力により作成した正解データを元に評価を行った結果,高い適合率,再現率を示し,十分な妥当性を確認することができた. スナリバラフト 深層強化学習による施工機械の経路生成. 本研究では,不整地をブルドーザのような施工機械で整地する作業の自律化を想定し,Double DQN(Double Deep Q Network)を用いることによりブルドーザが自律的に最適な運転経路を生成することを目指す.これまでに筆者らは,Double DQNを整地シミュレーションに適用して経路計画する研究を行ったがネットワークへの入力が画面データのため,入力サイズが大きく計算負荷が高くなことが課題であった.そこで本研究では入力サイズを小さくすることで,ニューラルネットワークの規模を縮減し,ニューラルネットワークにおける計算コストを減らすことで学習の高速化を図ることを目的とする.具体的には,ネットワークへの入力を画像データの代わりに,ブルドーザや土砂の座標データもしくは,ブルドーザと土砂との相対座標とし,入力の次元を小さくした場合の学習を行い,経路の最適性と高速化について検証する. スナリバラフト 創作者と人工知能:共作実現に向けた創作過程とメタデータ付与4コマ漫画ストーリーデータセット構築. 人工知能技術の発展により,創作物を計算機が理解したり,自動生成することに強い関心が集まっている.画像キャプション生成や自動彩色,スケッチ生成など,創作に関わる特に深層学習を利用した技術に近年大きな発展が見られる.一方で,人の創作は高次の知的作業であり,計算機上に創作過程全体を具現化することは極めて難しい.この分野において,創作物が貴重で繊細な情報をしばしば含むため,機械学習向けのデータが非常に少ない.本研究では,「創作者と人工知能」の共作に向け,創作過程とメタデータを有する4コマ漫画ストーリーデータセットを構築する. スナリバラフト 図形認識のための多層ニューラルネットにおける大局構造の抽出. 多層ニューラルネットは様々な実データに対し,高い予測性能を実現しているが,その内部表現を人が理解することは難しい.我々はこれまで,データから学習された多層ニューラルネットに対し,ネットワーク解析を適用することにより,各層において隣接する層のユニットと似た結合パターンを持つユニットのグループ(コミュニティ)を推定する方法を提案してきた.これらの研究においては,ニューラルネットから抽出された各コミュニティ間に存在する複数の結合を,閾値処理に基づいて1本の結合束として表現することにより,構造の単純化を行っていたが,コミュニティ間がどの程度強く結びついているかを知る方法は存在していなかった.本研究では,多層ニューラルネットから抽出されたコミュニティ構造に対し,新たな結合束の定義法と可視化手法を適用することにより,各コミュニティが入力側の層におけるどのコミュニティと最も強く結びついているかを知ることを可能にした.また,実際に図形認識のデータセットを用いて学習した多層ニューラルネットに対し,提案法を適用することにより,各コミュニティの役割について考察を行った. スナリバラフト 道路交通システムにおけるプローブ情報を用いた交通流予測手法の検討. 近年のITS(Intelligent Transport System:高度道路交通システム)の著しい発展により,道路交通情報や車両の様々な情報を容易に収集することが可能になっている.交通流を把握・予測するために収集される情報には,路上に設置されたセンサにより得られる観測情報と道路上を走行する車両から収集されるプローブ情報がある.プローブ情報によって,センサが設置された地点の観測情報に加えてより広範囲の道路交通情報が得られるようになっている.本研究では,プローブ情報を用いて一般道における交通流予測手法を検討する.交通流は複雑であるが,特徴量を自動的に獲得できる深層学習によって,現場の特性といった事前知識を把握していなくても交通流の特徴を表すことができ,交通流予測においても精度が向上すると期待される.そこで,本研究では,深層学習を用いた交通流予測モデルを検討する.また,他の交通流予測手法と比較を行う. スナリバラフト 電子顕微鏡連続切片画像セグメンテーションにおける深層学習の利用に関する研究. コネクトミクスと呼ばれる分野においては,電子顕微鏡連続切片画像の3次元再構築法により,神経系のミクロな構造の観察がなされている.この作業にあたっては,神経細胞の自動セグメンテーションが重要であり,近年では深層学習を用いた方法が注目を浴びている.しかし,深層学習の適用においては,精度向上を図るための工夫に数多くの選択肢が存在する.本稿では特にハイパーパラメータの設定に焦点を当て,その決定方法を検討する.既存手法のうち特に高い精度での処理が期待される,Deep Contextual Network(DCN)は,ネットワーク内部にて,空間周波数の異なる特徴マップを複数有している.本研究では,この構造に注目し,特徴マップの可視化に基づいたハイパーパラメータ調整手法を提案する.2種類のデータセットを用いた実験の結果,提案手法にて逆畳み込み層のフィルタサイズを変更することにより,DCNの精度を高められることが明らかになった. スナリバラフト 大量のTwitter画像を用いたConditional Cycle GANによる食事写真カテゴリ変換. 本研究では,深層学習技術を用いて,食事の見た目はそのままに,カテゴリのみを変える食事画像変換を実現する.例えば,牛丼をどんぶりの形状や見た目はそのままに天丼や親子丼,海鮮丼などに自由に変換することを実現した.本研究では,CycleGANの手法を拡張し,1つの変換ネットワークで複数のカテゴリへと変換可能とするconditional CycleGANを用いた食事画像変換手法を提案する.Twitterから長期間にわたって収集した23万枚の食事画像を利用することによって,高画質な食事画像変換が実現できることを示す. スナリバラフト 深層学習を用いた収穫日予測手法の検証. 農業の経営手法の一種である契約栽培は,営農者が取引先との価格交渉を直接行えるという利点がある.しかし契約栽培では多くの場合において農作物の収穫日や収量を正確に予測することが前提条件であり,これには技術的あるいは技能的な予測手法が必要となる.従来この問題は熟練営農者の経験則によって解決されてきた.しかし新しく農産業に参加する新規営農者にとっては経験則に依る手法は意味を持たない.また熟練営農者にとっても異なる品種,圃場,作業日程で複数の作物を管理する場合,それらすべての収穫日予測を行うことは困難である.本研究グループではこれまで,深層学習の一種であるディープニューラルネットワークによる自動的な収穫日予測手法について提案してきた.本論では提案手法の予測精度について検証する. スナリバラフト 深層学習によるFacebook広告のCTR予測. 技術の発展に伴い表現力の高いインターネット広告が増えている中,ユーザーと広告主双方に利点のある広告のクリック率(CTR)予測が盛んに行われている.その広告に関連するあらゆる情報,例えば広告の出ているメディアやページ内の表示場所,広告を見たユーザーのデモグラフィック,広告主とその商品,クリエイティブと呼ばれる広告バナーの画像や文面等がクリックを引き起こす要因として考えられる.しかし,高速なレスポンスタイムが求められるインターネット広告では,情報量が多く処理や学習に時間を要してしまうことから,画像や文面を用いて予測性能を改善したり,知識を抽出する研究があまり進んでいない.その解決策として高次元タスクにおいて顕著な成果を上げているDeep Learningを用いて画像やテキストといった各要素をEnd-to-Endに学習させ,得られた結果から配信影響について議論する.また,従来の手法との比較実験から考察とまとめを行う.本研究の目標は,新規の広告に対してCTRを見積もること,また学習されたモデルからCTRに寄与する特徴,配信影響を発見することである. スナリバラフト 深層学習を用いた高解像度画像からの人物カウント. 観光地でのIT導入があまり進んでおらず,ITを導入することで改善される問題は多く存在する.例えば,観光地などで人物カウントを自動で行うシステムを導入することによって,観光地の集客力を定量的に分析することが可能となる.本研究では,広域の観光地を捉えた高解像度の画像から人物をカウントする手法を提案する.人物カウントのシステムの先行研究は複数存在するが,いずれも狭域を捉えた画像を扱っている.広域を捉えた画像は,人がいないエリアが,人がいるエリアよりも大きく,不均衡なデータである.我々の提案手法では,CNNを用いた密度推定に,サンプリングアルゴリズムを導入することによってデータの不均衡性に対処した.この手法の有効性を示すために,江ノ島の海岸を捉えた画像をデータセットとして用いて実験を行ったところ,既存手法を上回る精度を出すことができた. スナリバラフト 学習事例を上回る大洪水に対する深層学習水位予測モデルの検証. 洪水氾濫災害に対するソフト対策として,洪水予測の精度向上は重要である.洪水予測にはして様々な手法が提案されており,そのうちの一つにニューラルネットワーク(ANN)によるものがある.これまでの研究で,様々な河川においてANNモデルの適用性が報告されているが,他の手法と比べた精度の優位性は示されておらず,全国の洪水予測システムなどで実用に至っている例は少ない. また,ANNをはじめとする機械学習モデルの一般的な弱点として,学習事例を上回るような事例に対しては予測性能が担保されない,という点が挙げられる.洪水予測においては,学習事例を上回るような大規模洪水への対応こそが重要である.そのため,ANNによる洪水予測モデルは十分な信頼性を得られておらず,防災現場への実用化が進んでいない. こうした課題への対応として,本検討では2016年の台風10号で生じた網走川における過去最大の洪水事例を対象として,ANN洪水予測モデルの適用検討を行った.学習事例を上回るような高い水位の洪水に対しても,「水位変化」に着目して学習を行うことで,予測モデルの適用性が保たれることを示した. スナリバラフト 心的状態の時間遅れと持続モデルを考慮した生体情報からの学習者の心的状態推定の試み. 教授・学習過程において学習者の心的状態を把握することは教育効果・学習効果の観点から極めて重要である.特に,学習時における教師の行動や発言と学習者の心的状態,あるいは心的状態の変化に関する要因との関係の形式化は重要な課題であり,その成果は学習支援システムへの学習者の心的状態の推定機能の実装のための基礎的な知見を与えることも期待される.著者らは,教師と学習者のインタラクションにおいて教師の発話と学習者の生理データ,および学習者の心的状態との関係の形式化を試みてきている.そこでは,生体情報,発話情報,内省報告等,学習に関わる情報を多面的に用い相関ルールにより関係の形式化を試みている.一方,機械学習アルゴリズムの学習支援を含めて様々な分野への応用可能性も示されてきている.そこで,本研究では,上記と同様の学習に関わる多面的情報から深層ニューラルネットワークを用いて学習者の心的状態の推定の可能性を検討した.特に,時限解析による時間遅れ,心的状態の持続モデルを考慮することによる推定精度の向上の可能性を検討した. スナリバラフト 原子力発電所の電気系アイソレーション計画の深層学習による自動生成. オペレーション&メンテナンス高度化のための人工知能を活用したアプリケーションのひとつとして,深層学習を用いた電気アイソレーション計画の自動生成を研究している.現在,熟練した技術者が,数百もの回路図や関連図書を用いて,工数をかけてアイソレーション手順の計画を作成している.この作業が自動化されれば,非常に効率的である.自動化の主要な課題は,電気回路シミュレータの膨大な計算時間である.我々は深層ニューラルネットワーク(DNN)を計算時間削減に適用し,効率的な経路探索アルゴリズムをDNNの内部に構築した.DNNの計算時間は,回路シミュレータに比べて560倍短縮した.全結合型ネットワークとグラフ畳み込みネットワークとでは精度に有意差はなかった. スナリバラフト 人の動作,物体検出およびそれらの位置情報を考慮した動画像からの文生成. 近年,監視カメラによる不審者の挙動の把握や高齢者の見守り,スポーツの実況中継など,人の動作を言葉によって報告する技術の必要性が高まっており,深層学習を用いた画像や動画像の言語化に関する研究が盛んに行われている.しかし,画像や動画特徴量から直接文章を生成する手法が多く,人間が実際に画像や動画像を見て認識するような事象,特に人の動作について正しく捉えて言語化する手法はほとんどない.そのため,本研究では,深層学習を用いて,動画像中の人の姿勢と物体を正しく捉えた説明文生成に取り組む.具体的には,動画像のフレームごとに人の姿勢情報を抽出し時系列情報として,動作を表す単語を選択する処理と,フレームごとに物体を検出する処理を合わせ,それぞれの処理において得られた結果から動画像説明文生成を行う. スナリバラフト 変分自己符号化器を用いた表現の多様性のモデル化による表現豊かな音声合成. 近年深層学習を用いた自己回帰生成モデルは音声合成の性能を向上させている. しかし,自己回帰生成モデルに基づいた音声合成システムに表現の豊かさを備えさせることは,自己回帰生成モデルが話者性,話し方といった音声の大域的な特徴を学習するのが苦手であることから,まだ未解決の問題となっている. 本稿では,VAEと自己回帰モデルの一つであるVoiceLoopを統合したモデルVAE-Loopを提案する.従来の自己回帰生成モデルに基づいた音声合成モデルと違い,提案手法は音声の大域的な特徴をVAEによって明示的にモデル化することができる. VCTKやBlizzard2012を用いた実験では,VAEが学習した大域的な特徴を用いることで,VoiceLoopがより高品質な音声を生成すること,及び表現をコントロールできることを示す. スナリバラフト Bottleneck特徴量を用いた不動産画像の分類. 現在,深層学習による技術革新が進み,データ分析の精度が飛躍的に高まっている中,一方で,不動産業界においても大量に蓄積されたデータの活用について,家賃推定や新たな推薦システムの導入など様々に議論が行われている状況である.本論文では,不動産画像データを畳み込みネットワーク(CNN)によるBottleneck特徴量を用いた分類手法を提案し,CNNを利用した際の精度について検証する. スナリバラフト グラフカーネルフィルタをもちいた楽曲の画一な印象の獲得. 楽曲の印象は人により異なる.この個人に依存する感性は個人差が大きく,定量化は困難である.また,時間経過とともに感性は変化するために,定点観測も必要であり時間を要する.本件では近年注目されている深層学習の内,フーリエ変換の性質をもつグラフラプラシアンに注目し,計算機実験による実験の時間短縮と,楽曲の感性に影響を与える周波数特性の傾向を明らかにする. スナリバラフト 色彩調和に基づく衣服コーディネートシステムの提案. 近年,衣服通販サービスや衣服推薦サービスの発達によって,衣服の画像や文書データが容易に収集可能となった.最近では,機械学習や深層学習でそれらのデータを学習することで様々なモデルが提案されている.さらに,色彩理論も様々提案され,色の組み合わせがファッションに大きく影響することも示されている. 本研究では,衣服コーディネート画像を入力することで衣服の色を推薦するシステムを提案する.本システムは二つのモデルによって構築される.一つ目は,画像を衣服ごとに領域分割するパーシングモデル,二つ目は色彩調和論に基づいて衣服の色の組み合わせを評価する調和評価モデルである. スナリバラフト 機械学習を用いた鮮度計測に向けたレタスのマルチ分光センシング. 従来の鮮度・品質計測手法の多くは分離分析であり,計測に非常に時間が掛かる等の問題点が多数存在した.そこで,本研究では元素と有機物に着目し,レタスの劣化過程の定量を試みた.さらに表面色彩と水分計測から,外観品質による鮮度(劣化)評価と客観的評価の関係性を把握し,将来的に機械学習に繋がる鮮度評価のためのデータセットと評価方法を検討した.この結果,レタス表面色彩(色相,彩度)の変化と内部品質の関係性が認められたため,実験データを蓄積し機械学習・深層学習を用いて色彩の変化点と内部品質の関係性の解析を行うことで,表面の色彩情報だけを用いてレタスの鮮度を定量・予測できる可能性が示された. スナリバラフト 深層敵対的生成ネットワークを用いたマンガイラスト自動生成の試み. 本研究では深層敵対的生成ネットワークを用いたマンガイラスト(1コマ分に相当する画像)の自動生成を試みる.近年,深層学習を用いて自動的に画像を生成する研究が数多く行われてきたが,その際に用いられるモデルの一つに敵対的生成モデルがあり,高品質な画像を生成するための様々な手法が提案されてきた.ただし,これら研究の多くが検証に用いるデータセットは情報量が多い写真画像を対象としたものとなっているため,主にモノクロの線画によって構成され,かつ様々なシーンが描画されるマンガイラストに対してはこれらが適切とは言えない可能性がある.一方で,イラストを敵対的生成ネットワーク(GAN)によって自動生成する研究や,マンガを対象として人工知能を用いる研究も従来より数多く行われているが,マンガイラストを直接生成しようとする試みは,あまり行われていなかった.そこで,本研究では深層敵対的生成ネットワークを用いたマンガイラストの自動生成実験を,使用する層の数や損失関数を変更することで複数回行い,その結果を考察する.本研究にて得られる示唆は,人工知能によるマンガの自動生成を研究していく上で有益なものになると考えられる. スナリバラフト 「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法. 「ロボットは東大に入れるか」プロジェクトの英語における意見要旨把握問題の解法について述べる. 具体的には,RACEと呼ばれる大規模な英語問題のデータセットを用いた 深層学習の手法により,Word2vecの類似度に基づく手法よりも高精度に意見要旨把握問題が解けることを示す. 今回,30%の正解率を44%まで改善することができた. スナリバラフト 内的報酬と敵対的学習によるタスク非依存な注意機構の学習. 近年,人工知能の活用による社会の生産性向上への期待が高まっている.この期待の背景として,深層学習が人工知能技術のブレイクスルーになったことが挙げられる.しかし,実世界環境で活用可能な人工知能の構築には,いくつかの課題が残されている.特に,観測が部分的であること,タスクに対する報酬の設計が難しいことの2点が挙げられる. 部分的な観測を扱うニューラルネットワークのモデルとして,注意機構を持つモデルが提案されている.しかし,これらのモデルでは,注意機構の学習がタスクから定義される外的な報酬信号を用いた強化学習によって行われており,外部からの報酬信号が得られない問題設定下では注意機構の学習を行うことができない. 本研究では,注意機構の学習に外的な報酬を用いる代わりに,観測に対する予測の誤差を注意機構の内的な報酬として与え,観測の予測モデルと注意機構を敵対的な学習により訓練する手法を提案する. スナリバラフト CNNによる感情認識における生理心理的制約の効果. 本研究では脳波(EEG: Electroencephalogram)と深層学習を利用した感情認識における生理心理学的研究からの制約を検討する.本研究では特に,EEGの周波数解析手法を,畳み込みニューラルネットワークに適用することの効果に焦点を当てる.実験の結果,我々の手法は感情の快-中立-不快の分類に一定の可能性を示した.その一方で生理心理学的知見による単純な次元削減には良い効果が得られないことも示された.また,我々の手法は標準的な機械学習の手法に比べてよいパフォーマンスを示さなかったが,畳み込みニューラルネットワークの可視化手法を適用することで,脳波からの感情識別にかんする有益な知見を得ることができた.結果をまとめれば,我々の手法は,分類器として有用であるというより,EEGと感情状態に対する分析手法として有用であることが示唆された. スナリバラフト 船舶のタンク・ホールド内画像認識に関する研究. 船舶のタンク/ホールド内の点検に,ドローンを活用しようとする動きがある.点検箇所へのアクセスが容易になる一方,ドローンで撮影した映像を通して現場判断するため,画面上で状態評価を支援する技術が望まれる.本研究では,深層学習(Faster R-CNN)を用いた検出技術を,第一段階としてばら積み貨物船のホールド内の構造部材の認識に適用させた.タンク/ホールド内でドローンを飛行させた実績が少ないため,ここでは,点検時に撮影した画像を基に学習・認識させた.撮影時の明るい環境での認識に加え,タンク内の暗い環境を模擬させた仮想実験も行い,その認識率を検証,解釈を行い,実用化に向けた課題を整理した. スナリバラフト M&A後の業績変化を考慮した買収候補推薦のための内容ベースニューラル協調フィルタリング法. 本稿では,M&A後の業績変化の可能性を考慮した買収候補の推薦を行う.特に深層学習を使った推薦手法の一つのニューラル協調フィルタリング法にマルチタスクラーニングの枠組みを導入した手法を提案する.実験結果ではM&Aの予測は,単純なロジスティック回帰法と比較して同等の精度であることを示す.本提案手法を用いることで,単に買収先を推薦するだけでなく,買収後にどういう利益を得られるかということをユーザに示すことができるだろう. スナリバラフト 意外性のある原因・結果表現の決算短信からの抽出. 本研究では,決算短信から意外性のある原因・結果表現を自動的に抽出する手法を提案する.本手法は,原因表現にある名詞が出現するときに結果表現に名詞が出現する条件付き確率と,決算短信から抽出されたキーワードを用いて意外性のスコアを算出することで意外性の判定を行う.さらに,原因・結果表現の結果表現に対して深層学習により業績要因の判定を行うことで不適切な表現を除去し,意外性のある原因・結果表現を精度よく抽出する. スナリバラフト lstmを用いたパーソナル対話技術. 近年,LSTMを用いた対話応答学習の研究が盛んであり,チャットボットシステムへの応用が行われている.しかし,現状のチャットボットは全体最適化されたAI応答を返すものが主であり,個人ごとの特性に応じたAI応答の選択はできていない. 本稿では,現在のユーザの発話に応じたAI応答の選択を行うにあたり, ユーザの過去の発話列から,現在の発話と関係付けられるトピックをアテンションモデルを応用し,抽出し,ユーザの現在の発話の表現ベクトルに反映する.それにより,ユーザの時々の発話と,過去の発話に応じた,パーソナライズされたAI応答選択が実現できる. また,選択されたAI応答へのユーザの反応を基にAI応答の選択をオンライン学習する枠組みを提案し,より個人化されたAI応答選択を強化する スナリバラフト Graph of Graphsに対する二重畳み込みニューラルネットワーク. グラフは一般的かつ強力なデータ表現技法で,化合物やソーシャルネットワーク等の複雑な構造を表現する際に有用である.グラフ構造で表現されるデータに対する機械学習の応用も盛んに行われているが,既存の機械学習手法の殆どはデータが固定長のベクトルで表されていることを前提としているため,グラフの適切な取り扱い方について多くの研究が成されてきた.近年のグラフニューラルネットワークは,グラフからの自動的かつ柔軟な特徴抽出を可能にし,予測精度を大きく向上させた.本論文では,これまで別々に研究が成されてきた外部グラフ及び内部グラフから構成される,より一般的なグラフ構造であるgraph of graphsのノードに対して,内外を統合する一貫学習による二重畳み込み法を用いて特徴表現学習を行う.実データを用いたリンク予測実験で,提案手法の有用性を示す. スナリバラフト 低解像度の料理画像を超解像するためのSRGANの応用. SRGANは超解像手法の中でも特に人間の見た目に美しい高解像度画像を生成することができる.しかし,このモデルは一定度の解像度の画像を更に超解像をする目的で考案されたもので,過去に撮影されたノイズを含むような低解像度画像を超解像することは困難である.過去に撮影された低解像度画像から画像の細部情報を失うことなく自然な高解像度画像を生成できることは,我々のサービスにとって有用である.そのため,本稿では対象を料理画像に絞る.超解像モデルの学習はある画像とその画像を低解像度化したもののペアから情報を復元するように実施されるという構造に注目し,我々の目的に資する2つのアプローチを提案する.一つ目は,低解像度化をする際に人為的にノイズを加えるという手法である.二つ目は,ドメイン毎にデータを分けてそれぞれでモデルを学習するという手法である.本稿で使用したのは,{牛肉,鶏肉,食パン,パウンドケーキ}の4種類である.これにより,既存手法と比べ本稿の手法では定量的・定性的に自然な高解像度画像の生成結果が得られた. スナリバラフト 俳句生成への多重的アプローチの考察. 筆者らはコンピュータによる俳句生成を研究している.俳句は基本的に十七音で,断片的な単語から構成されており,コンピュータによる俳句生成は興味深い研究テーマである.これまでいくつかの俳句生成の取り組みを行ってきたが,本論文では,以下の二種類の俳句生成のアプローチを含む,これまでの筆者らの俳句生成の研究に基づき,主に記号処理の手法を用いたトップダウンの生成と,深層学習のようなニューラル処理によるボトムアップの生成を統合したアプローチの可能性を示す. スナリバラフト 市街地の自動運転における環境情報のフィルタリング. 本稿では,DRL(Deep reinforcement learning)によって出力された行動の説明可能性の不足に着目する.DRLは,Atariのゲームやロボットのナビゲーションなど,多次元のビジュアル入力によるタスクの優位性を示している.また,DRLは,自動運転を実現するための有用なアプローチとして期待されている.市街地における環境下では多くの環境情報が利用できるが,適切な行動を決定するために不可欠な入力を特定することはできない.DRLから得られた結果は,シンボリックな方法で書き留めることによって別のシステムに転送することが難しい暗黙知である.したがって,自動運転車の設計者は,これらの結果を受け入れて利用しない可能性がある. 上記の理由から,記号表現に到達する第1段階として,適切な行動のために必要な入力を指定するフィルタリング方法を提案し,実験を通して提案法の有効性を示す. スナリバラフト 小学生の書道基本姿勢定着に向けた点画検出および採点手法. 初めて書道に触れる小学生から書道に対し基本姿勢を身につける方法として点画の練習が挙げられる.点画は書道の基本技術であり作品を構成する上で極めて重要な要素である.そこで本研究では,時と場所を選ばず練習できる環境を得られるアプリケーション実現のため,自動的に書作品評価を行う手法を提案する.書作品内に含まれる点画検出を物体検出問題として扱い,検出した点画評価することで書作品の点数付けを行う.本研究ではSingle Shot Multibox Detectorを適用する.データセットには実際の書道教室に通う小学生の書作品を用いる.提案手法の有効性を検証するため実験において点画検出の精度比較と点数付けの定性的評価を行なった.その結果,提案手法の有効性を確認できた. スナリバラフト 畳み込みニューラルネットワークによる建築物の被災度判定. 2016年熊本地震において,多くの建物被害が発生した.地震等の自然災害発生後に迅速な復旧活動を行うためには,可及的速やかに被災地の被害状況や分布を把握することが不可欠である.本研究では,深層学習の手法の一つである畳み込みニューラルネットワークを用いて,建物の外観の画像データから被害の有無を判定する手法について検討する.さらに,CNNによる被害判定結果を地図上に表示し,被害の地理的分布を把握する手法を構築する. スナリバラフト LRP法による畳み込みニューラルネットワークにおける中間層の振る舞いの可視化. 近年,深層ニューラルネットワークのような複雑な構造をもつ機械学習モデルの予測性能が向上し,実応用で重要な役割を果たしている.一方,それらのモデルの振る舞いが人間にとって明らかではないため,常にモデルの改善の必要性に迫られている利用者にとって,モデルの解釈が重要な課題になりつつある.本論文では畳み込みニューラルネットワークの中間層の振る舞いに注目し,LRP(layer-wise releavance propagation)法により中間層の振る舞いの可視化を行う.この可視化により得られた幾つかの知見について報告する. スナリバラフト 文の分散表現に基づく小説のストーリー解析手法の提案. 近年,計算機の爆発的な発展を背景として,深層学習(Deep Learning)に代表される人工知能技術が大きく成長してきた.その中で小説や漫画,絵本のような物語を計算機によって自動生成する試みや,人が物語を創作する際の創作支援を計算機にさせる試みが大きな注目を集めている.物語とは人の感性に基づく創作物であり,ストーリーと表現媒体という2つの要素に分解できる.本研究では言語のみの単一表現で生成されている小説を解析対象とする. 物語の解析に関する研究は数多く報告されている.しかしながら,これらの研究では単語やオノマトペの使用頻度といった物語の表層的な特徴のみを用いており,文の意味のような深層特徴を用いていないことが問題点として挙げられる. 以上の点を背景として,本研究では文の意味を考慮した小説の解析方法について述べる.具体的には,LSTMおよびAutoencoderを用いて生成した文の分散表現を基礎として,そこからいくつかの特徴を生成して小説におけるストーリーの展開を解析する手法を述べる. スナリバラフト 構造化深層生成モデルによるfMRI画像を用いた精神疾患診断. fMRI脳画像に基づく精神障害診断は,fMRI画像が高次元かつ小規模のサンプルで構成されているために,従来の研究では特徴抽出や相関分析のような前処理をデータセットに施す.しかしながら,この前処理は診断に必要な特徴を失う可能性もある.一方で,深層生成モデルと呼ばれる手法は,小規模なデータセットでも高い精度を達成することができる.本研究では,subject-wise変数(被験者ごとの変数)を用いた深層生成モデルによって,fMRI脳画像をモデル化する.この提案手法では,fMRI脳画像の個人差,時間的雑音,および精神疾患の有無を明示的に分離することができる.提案手法が他の従来手法よりも高い精度を達成することができることを示す. スナリバラフト Deep Q-Networkを用いたマルチエージェントによる交通信号制御システムの提案. 近年,都市部では交通渋滞による時間的・経済的損失が深刻化しており,生活に多大な影響を及ぼしている. こういった交通渋滞の原因として,こと一般道路においては信号の適切でない切り替わりが挙げられる.そのため信号機を制御し,交通行動を効率化することは交通渋滞を解消する方法の一つになる. 信号制御の手法として,高い特徴抽出能力を持つ深層学習法と,報酬に基づいた最適な行為を学習する強化学習法を組み合わせたDeep Q-Networkを用いた手法が提案されている.しかし,Deep Q-Networkを用いた先行研究では,交差点の数が増えるほど,指数関数的に計算量が大きくなる. そこで本研究では,Deep Q-Networkを用いた制御手法にマルチエージェントシステムを組み合わせることで計算量を減らし,適切なパラメータ操作を出力する手法を提案することを目的として実験と評価を行った.その結果,エージェント同士が協調を行うことにより,効率的な信号制御を行うことが出来た. スナリバラフト 重み予測を用いたMLPの初期化による少数例からのダイナミクス深層学習. ダイナミックシステムにおいて,そのシステムが取りうる全ての状態遷移が完璧に得られれば,論理的機械学習手法を用いて完璧なモデルが得られる.しかし実世界では,観測データや状態遷移を完璧に得られることが珍しい.一方,統計的機械学習も同様にデータ飢餓の問題がある.本研究では,重み予測を用いた多層パーセプトロンの初期化方法を提案する.重みを予測することにより,学習データが少ない場合でも過学習を避け,モデルの学習がうまくいくことを示す. スナリバラフト 深層学習による海岸保全施設の劣化の新たな予測手法. 我が国の海岸に設けられた護岸,堤防等の海岸保全施設の延長は9,600kmに達する.その維持管理は,主に巡視・点検という人の手で行われている.海岸保全施設の維持管理を効率的に行うには,施設の劣化状況を適切に予測する必要がある.そこで,深層学習による海岸保全施設の劣化の新たな予測手法の枠組みを提案した.基礎的な検討として,風向データに基づいて劣化予測モデルを構築した結果,正答率平均値は0.44であった.今回は十分な精度は得られなかったが,その原因として考えられる点を今後の課題として整理した. スナリバラフト 特徴グラフを用いた汎用型CNN深層学習手法の開発. 畳み込みニューラルネットワーク(CNN)を非画像データに適用する方法を提案する.CNNは,画像処理や音声認識などの多くの分野で成功しています.一方,csvファイルなどの非画像データにCNNを適用することは困難でした.画像のような低次元グリッド構造のデータの順序は意味を持ち,CNNはその順序を画像の特徴として認識して処理する.したがって,CNNは,構造を変更できる非画像データに対して特徴認識を行うことができなかった.我々は,非画像データのシーケンスに意味を与えることによってCNNを適用可能にする方法に焦点を当て,改善を加えることによって提案手法の有効性を実証した. スナリバラフト 仮想空間上の灯明光源効果を用いた時代屏風の再現. 近年,IT技術と芸術を融合した新しい研究領域の試みとして,日本美術の代表となる源氏絵のオントロジーを用いた研究および深層学習を用いた源氏絵の分析などの研究が進められている.本研究では仮想空間技術を利用して,平安貴族が鑑賞したと思われる時代屏風の再現を試みる.時代屏風は背景に金箔が貼られており,平安時代には照明器具として灯明が用いられていた.一般に,芸術作品を灯明のような燃焼を伴う灯りで鑑賞することは安全性の観点から困難である.この問題を仮想空間上で灯明の灯りと金箔からの光源反射を忠実に再現することで解決する. スナリバラフト 深層学習を用いたゴミ収集動画からゴミ袋個数の測定. 持続可能な社会を実現するために,ゴミ減量化運動が日本各地で行われている.ゴミを減量するためには,人々に自分がどれだけゴミを出したのかや削減したのかなどを知らせることでゴミ減量への意識を高める必要がある.しかし,現在得られるゴミの量のデータ粒度は市や区単位といったものであり.人々のゴミ減量への意識を高めるにはさらに微細粒度なゴミの量のデータが必要となる.これらのゴミ量のデータを人で集めることは可能であるが,コストの観点から現実的ではない.したがって,自動的に収集可能なシステムの研究開発が必要である.本研究では,清掃車に取り付けられたドライブレコーダーで撮影された動画とGPSの位置情報を用いて,地域の微細粒度なゴミの量を自動的にリアルタイムセンシングするシステムを提案する.特に,畳み込みニューラルネットワーク(CNN)を用いたゴミ袋をカウントする手法を実装し,実際に藤沢市を走行する清掃車後部に取り付けられたドライブレコーダーで撮影された動画を用いて実験を行い,手法の精度について評価を行った. スナリバラフト 深層学習を用いた心電図波形の長期変動パターン抽出法. 心電図の自動解析が試みられているが,多くの手法は短時間の波形のみに着目する.診断において心電図波形の経時的な変化が重要となることに着目し,本稿では長時間の心電図の変動をパターンとして抽出する手法を提案する.提案手法は,時系列データの時間変化を特徴空間における軌跡として表現する手法と,オートエンコーダによる特徴抽出を組み合わせるものである.評価実験によって,パターンに対して規則性や疾病との関連性が示唆されたことを示す. スナリバラフト 深層混合モデルによるクラスタリング. クラスタリングは機械学習および人工知能の分野において重要なタスクである.確率論的生成モデルは効率的な推論のためにはデータに対して強い仮定が必要であり,混合ガウスモデル(GMM)を用いたクラスタリングには特徴エンジニアリングが必要であった.ここ数年,Variational Autoencoder(VAE)とGMMを組み合わせたモデルで複雑なデータをクラスタリングする研究が注目されている.本稿では深層混合モデル(DMM)を提案する.DMMでは,まず潜在的なベクトルがGMMにより生成され,次に潜在ベクトルが観測データに変換される.DMMは結合尤度の下限を最大化することで訓練される.実験では,提案モデルは,GMMによってクラスタリングすることが困難なデータのベースラインの手法と比較して最も良い性能を示した. スナリバラフト Deep Residual 3D U-Netと3DCNNによるCT画像セグメンテーションの改善. 高精度かつ高速な医療画像のセグメンテーションは,多くの医療現場において重要な課題である.現在ではその手法の一つとして,エネルギー最小化問題に基づくグラフカットが利用されている.しかし,グラフカットでは,隣接するピクセル値が類似している場合,完全かつ自動的にセグメンテーションを行うことは困難である.この問題には多くの対策があるが,そのほとんどは実行速度という点で適していない.それに対し,深層学習による手法は,複雑な特徴を獲得することができるため,自動セグメンテーションが可能である.本研究では,Residual Unitによって拡張した3D U-Netと,セグメンテーション結果を修正する3DCNNを組み込んだモデルを提案する. スナリバラフト イラスト自動生成のためのSketch RNNの解析. Googleが公表するsketch RNNを利用したイラストの自動生成をもとに画像生成システムの提案をする.sketch RNN筆順で構成されたRNNである.我々のシステムは従来のCNN等の手法と異なり,ユーザの入力による連続した筆順を使用する.この違いは出力画像をより滑らかで自然なイラスト風の画像にする.我々はこのsketch RNNを画像生成システムに取り入れた.本稿では,2つの視点に着目する.1つ目は,出力がどの程度入力と類似するか確認する.2つ目はsketch RNNの中間出力の潜在ベクトルを任意で選んだ際,連続的なイラストが得られるか確認する.これらを通して,我々は新しいイラスト生成システムを模索する. スナリバラフト Stacked Recurrent Neural Networkによる桜島噴火予測. 火山の噴火は時として多くの人々に甚大な被害をもたらす.本稿では桜島に設置されている観測装置(伸縮計)から得られる時系列センサーデータから火山噴火を予測する我々の試みについて述べる.伸縮計の100分間のデータをもとに,その直後の60分間の火山の状態が"噴火"か"非噴火"かを予測することが目標である.Stacked Recurrent Neural Networkを用いて,平均F値66.1%の精度を達成した.また,時系列データを"Non-eruption","May-eruption","Warning","Critial"の4つのカテゴリに分類する4段階警告システムを提案する."Critial"カテゴリにおける爆発的噴火の割合は51.9%であった. スナリバラフト CNNによる画像形状特徴を利用した推薦システム. PMF(Probabilistic Matrix Factorization)はよく使われる推薦手法であり,研究だけでなく業界でも広く使用されている.近年,このアルゴリズムはさまざまな補助情報と組み合わされており,推薦精度がさらに改善された.本稿では,畳み込みニューラルネットワーク(CNN)を確率的行列分解(PMF)に統合し,画像形状特徴を用いた確率モデルを提案する. スナリバラフト 全天球画像のデータ収集と雲形と状態判定. 海上気象観測は安全な航海に不可欠であり,日本では一般船舶において観測結果を気象庁に報告することが求められている.しかし,雲の観測は気象測器での自動観測が困難なため,画像から自動識別する要求が生じている.これまで多くの研究で雲の種類(雲形)と雲量の分類に取り組まれてきているが,日本の海上気象観測で必要となる雲の状態までは研究されていない.そのため当研究では雲の雲形と状態を分類するための機械学習システムを開発した.まずはじめに全天球画像を撮影してデータサンプルを収集するための撮影デバイスを開発し,雲の層(下層,中層,上層)ごとに雲形と状態をラベル付けした.このデータセットをもとに,深層畳み込みニューラルネットワークを構築し,ResNet50学習モデルをfinetuningして分類した.結果として,雲形・状態ともに0.9を超える精度を達成した. スナリバラフト 入力データ非貢献部抽出によるCNNの出力の説明. 近年の機械学習技術の研究では,特に認識・予測の精度の高さに注目が集まっている. しかし,実応用の場面においては,単に精度だけでなくあわせてモデルの説明性が必要とされることがある. 本研究では,画像認識のための深層学習モデルであるConvolutional Neural Network (CNN)を対象に,その説明性を高める方法を提案する. CNNの説明性を高める方法として,モデルが入力画像のどの部分を根拠に認識を行っているかを特定してハイライトする方法が研究されている. このような説明法を用いることで,モデルの認識根拠を人間が視覚的に検証できるようになる. 提案法では,モデル説明のための新しいハイライト法として「モデル出力に寄与しない入力画像の非貢献部をハイライトする」方法を提案する. 従来の手法では,モデル出力と関連が強い入力画像領域を貢献部としてハイライトする. これに対し,本研究では非貢献部に着目することで,これら従来の手法とは逆のアプローチを取る. 提案法は従来法のようにモデル線形化のような粗い近似を必要としないという点において,モデルのより本質的な情報に基づいたハイライトを生成できると考えている. スナリバラフト 複数のGated CNNによるセンチメント解析. カーネルのサイズが異なった複数のGated CNNを用いたセンチメント解析手法を提案する.この手法により,複数の単語の組み合わせ方を考慮した解析が可能となる.ツイートを用いた評価実験により,線形SVMより良い正解率を達成し,特に1単語と2単語の解析を組み合わせた手法で最高の正解率を達成することができた. スナリバラフト 深層生成モデルによる非正則化異常度を用いた工業製品の異常検知. 工業製品の製造現場において最も重要であることの一つは,製造された工業製品が期待される仕様を満たしていないときに,その製品を不良品であるとみなして取り除くことである.現状では異常な製品の発見や除去は人手で行うことが一般的であり,企業は異常製品の除去に対して高い人的コストを支払っている.そこで,異常検知の自動化によって製品の点検にかかるコストを削減することが求められている.最近では,画像から直接尤度を求めることが出来る深層生成モデルと呼ばれる確率モデルが提案されており,異常検知において一定の成果を達成している.しかし,工業製品はその構造が複雑かつ多様なため画像内における各部分の出現頻度が異なり,尤度が必ずしも異常度に対応せず,正しく評価できないという問題がある.そこで本論文では,深層生成モデルにおいて非正則化異常度を用いた異常検知を提案する.非正則化異常度はデータが潜在的に含有する複雑さに堅牢であり,画像内における各部分の出現頻度に依存せず評価を行える.提案手法の有効性を検証するために,工業製品の画像データに対して本手法を適用させ,異常検知性能においてその有効性を既存の手法と比較する. スナリバラフト 深層学習によるユーザ評価モデルを導入した遺伝的プログラミングによる音楽自動生成手法の提案. 本研究では適応度景観を学習し近似的に評価関数を推定するsurrogate modelを応用した対話型進化型計算(Interactive Evolutionary Computation: IEC)による対話型音楽自動生成システムを提案する.本システムでは音の高さおよび長さの概念を反映した木構造によって楽曲を表現した.また,Genetic Programming (GP)の拡張手法であるGenetic Programming with Multi-Layered Population Structure (MLPS-GP)を音楽の探索アルゴリズムとして用いた.更に,既存の楽曲データから音楽的特徴を抽出,学習し,個体に対する近似評価をする評価モデルをsurrogate modelとして導入した.評価モデルの学習に当たってはVariational Autoencoder (VAE)を用い,楽曲学習時に生成される潜在空間に着目しつつIECと組み合わせることで,定量的かつユーザの嗜好を反映した音楽の自動生成を提案する. スナリバラフト 階層的な部分単語を入力としたニューラル機械翻訳. 本発表では,部分単語列を用いたニューラル機械翻訳(NMT)の精度向上を目指す. 我々は,NMTで部分単語列が用いられる3つのモジュール(1)エンコーダの入力層,(2)デコーダの入力層,(3)デコーダの出力層で,それぞれ適切な部分単語列は異なるのではないかという仮説を立てた. 実験により,複数の異なった部分単語列をエンコーダ,デコーダの入出力層に使用することで,IWSLT 2012,2013,2014の独-英,英-独,仏-英,英-仏データセットに対してBLEUスコアが向上することを示した. スナリバラフト Neural Programmer-Interpretersの拡張と四則演算を用いる文章問題の解答. 本論文ではNeural Programmer-Interpreters (NPI)の算術演算の拡張を行なった.NPIとはプログラムの表現と実行を学習できる再帰的,構造的なニューラルネットワークである.まず,我々はNPIがもともと可能であった加算だけでなく,その他の3つの算術演算(減算,乗算,除算)をNPIが実行できるようにした.その際,NPIにサブプログラムを共有可能にさせる拡張を行い,学習効率を向上させた.次に,四則演算を用いる,小学生レベルの算数の文章問題を解くことを考えた.このために,文章問題を数式表現に変換できる変換器を作成した.これはアテンションメカニズムを組み込んだSequence-to-Sequenceモデルを基にしたモデルである.このニューラルネットワークとNPIを用いて文章問題のデータセットを解き,提案手法の精度が他の既存の手法より優れていることを示した. スナリバラフト 異種の素性を併用した学術用語解説ウェブページの分かり易さの自動評定. インターネットで学術用語を学ぶ際,ウェブ検索に頼れば関連ページは容易に見つかる.しかし,「分かり易い用語解説」を見つけるには,検索上位ページを一つずつ見比べ読み進める非効率な作業が必要となる.本論文では,学術用語の検索上位ページの中で分かり易さを充足する必要十分な数の用語解説ページを見つけ体系化することを目的とする.特に,6個の個別因子のうち「レイアウトの見易さ」についての因子を対象とし,深層学習を用いてこの因子を自動評定する方式によって得られる特徴量,および,用語解説ウェブページのHTMLソーステキスト中のテキスト情報の特徴量を併用して,分類器としてSVMを用いて全体評定の自動判定を行う手法を適用し,異種の特徴量を効果的に併用可能であることを示す.特に,理工系学術用語を検索クエリとして収集した用語解説ウェブページを対象として行った評価結果をふまえて,提案手法の有効性を示す. スナリバラフト 会話によるニュース記事伝達のための発話意図理解. 我々はニュース記事のようなまとまった量の情報を音声対話によって効率的に伝達する会話システムの開発を行っている.ここで「効率的」とは,伝達対象となる記事の中から,ユーザーにとって不要な情報を除き,必要な情報だけを伝えることを意味する.このシステムにおいて,高い情報伝達効率(EoIT; Efficiency of Information Transfer)を実現するにはユーザーからのフィードバックが必要不可欠である.そこで,ユーザーからの多様なフィードバックを理解することを目的として,言語情報と韻律情報を組み合わせた発話意図認識手法を提案する.提案手法の特徴は,従来意図の種類ごとに観察に基づいて行われてきた特徴パラメータの設計を深層学習を用いることで,寄与率の高い韻律特徴量を自動で抽出しているところにある.我々の会話システムを用いて収集した対話データに基づいて設計した発話意図タグ付きコーパスを用いた実験により,提案手法の有効性を確認した. スナリバラフト ビットパターンカーネルフィルタによる細胞判定重複除去. 近年,深層学習法による画像認識精度が飛躍的に向上し,病理診断への応用も始まっている.今回,細胞判定重複の問題を解決するアルゴリズムを開発したので報告する.通常,格子状に各座標の部分画像について細胞判定が行われ,各種の細胞の個数が計数される.その際,部分画像が同じ細胞に含まれていると,実際には1個と数えられるべきにも関わらず,2個以上と計数されてしまう. 3×3のビットパターンからなるカーネルフィルタとして,Kernel_1(ON画素(1)のピクセルが1つのカーネル)を1個,Kernel_2を8個,Kernel_3を20個,Kernel_4を32個,Kernel_5を38個準備した.細胞判定のグリッドを走査し,パターンが一致した領域の中心部分をON画素として記録する.例えば,縦に3つ並んだON画素を中心の1つのON画素に収縮させるためには,Kernel3_5とKernel2_1の走査結果を合成し,Kernel2_3でさらに走査する,というような特定のフィルタの組み合わせが存在する.このようなフィルタを適切に組み合わせることで,細胞判定の重複を精度良く除去することができた. スナリバラフト U-Netによる手書き文字画像内のノイズ除去. オフライン手書き文字認識は,AIによる技術・アルゴリズムにとって未だに残る難しい課題となっている.これは手書きのドキュメントにて,スキャン処理を行う間に,画像内で頻繁にノイズがいくつか生じてしまうためである.スキャンされた画像にあるノイズの存在は,画像を濁らせたりぼやけさせたりし,読みにくくなってしまう.本研究では,3,036種類の日本語を含んだ607,200枚のサンプル画像の分析に,U-Netと呼ばれるCNNアーキテクチャの一つを用いて試みた.結果を通じて,U-Netには多種多様な手書きのスタイルに対しても,文字からノイズを除去し,ストローク部分を強調できるという十分な能力を持つことを示すことができた. スナリバラフト 脳表象モデルを用いた任意の視覚入力に対する知覚内容推定システム. 機能的磁気共鳴画像法(fMRI)を用いた脳情報解読は実世界における様々な応用が期待されているが,新たな解読をするたびにfMRIによる脳活動計測が必要となり,その計測コストが応用の大きな障壁となっている.そこで本研究では,視覚コンテンツに誘起される知覚経験を推定するための脳情報解読として,解読モデルを構築後は追加のfMRI計測を必要としない,全く新しい形の解読手法の提案を行う.提案手法は,個人脳データから構築される,視覚情報が誘発する脳活動を予測するモデルと,予測した脳活動から知覚内容を解読するモデルから構成される.学習済みの2つのモデルを連結することで,新規の視覚情報に対して,追加のfMRI計測なしに個人の知覚内容が推定可能になる.検証の結果,提案手法は知覚内容を適切に推定し,かつ知覚の個人差も推定することが示された.これにより,提案手法は,任意の視覚入力により誘起される個人の知覚経験を,脳内知覚表象を介して推定する計算システムとして機能することが示唆された. スナリバラフト 講義代行ロボットにおける双方向LSTMを用いたジェスチャ自動生成システムの性能評価. 従来のヒューマノイドロボットを用いた講義代行システムにおいて用いられるジェスチャは,人手で作成されたジェスチャである.ジェスチャの自動生成を行うことにより,専門的知識や労力を必要とせずにジェスチャを生成することが可能になり,講義代行システムの研究の発展に役立つことが考えられる.本稿では発話内容の意味的考慮が見込まれるジェスチャ自動生成を提案する.提案手法はBi-Directional LSTM,フィルタ補正および座標変換を用いて実装される. スナリバラフト 位置情報データによる競合店舗の利用状況の多様性を用いた購買予測手法の提案. マーケティングにおける戦略策定にあたり,自社で保有する顧客の競合他社の利用状況を考慮することは当該市場における自社でのロイヤルティを測る上で必須である.現在ではビッグデータ利活用の潮流とともに様々なデータが収集できるようになったが,サイト横断的なウェブ閲覧データを用いて市場全体の利用状況を推計できるEC(電子商取引)市場とは異なり,実店舗における競合他社での購買状況の把握は未だデータの収集には様々な課題が残っている.そこで本研究では,スーパーマーケットにおけるID-POSデータに外部の位置情報データを紐づけることで,自社顧客が競合の実店舗を訪問した履歴まで考慮した購買予測の手法を提案する.またその際には位置情報に対して消費者の行動の多様性を算出することで,予測器の次元数を削減した効率的な予測を実施する. スナリバラフト TULIP: Web小説を学習に用いた三段階LSTMによる台本形式小説(SS)生成. 本研究は,主にWeb上で投稿されている,台本形式小説(SS:ショートストーリーもしくはサイドストーリーの略とされる)を自動生成することを目的とする. 本研究は既存のニューラル対話モデルを各話者の特徴を考慮して拡張する.提案モデルであるthree-step unified LSTM interlocution producer (TULIP)は発話符号化LSTM,文脈更新LSTM発話復号化LSTMの三つのLSTMの結合によりなっている.本研究では提案モデルにWeb上の台本形式小説を学習させ,直接既存の小説を加工することなく一から小説を生成した.本研究では,質的,量的の双方の観点から出力した小説を評価し,提案するLSTMベースの手法が自然な日本語列を生成することを確認した.さらに,既存の定量評価手法の問題点についても指摘した.