本テキストは、JSAI2016における以下のセッションの発表のタイトル,および研究目的に関わる部分を予稿の冒頭部分から抽出しています。 ただし、参考文献等の引用部分はカットしています。また英語のみの一件は除いています。一部、抽出箇所が不適切な可能性があります点はご容赦ください。 1H2 データマイニング「テキストマイニング」. 2J3 データマイニング「データマイニング応用(1)」. 3K3 データマイニング「データマイニング応用(2)」. 1D2 Webマイニング「話題・属性の抽出(1)」. 2H5 Webマイニング「話題・属性の抽出(2)」. 1J3 自然言語処理・情報検索「情報抽出」. 1N2 自然言語処理・情報検索「自然言語処理(1)」. 2K3 自然言語処理・情報検索「自然言語処理(2)」. 4B1 自然言語処理・情報検索「自然言語処理(3)」. 4B4 自然言語処理・情報検索「情報検索と談話理解」. 1K4-OS-06a オーガナイズドセッション「OS-6 ことば-コンピュータ-コミュニケーション (1)」. 1K5-OS-06b オーガナイズドセッション「OS-6 ことば-コンピュータ-コミュニケーション (2)」. スナリバラフト インターネット広告のロバストなCVR推定モデル. 本研究では、まずユーザー群の広告表示位置(表示枠) における広告キャンペーンのCVR を確率命題を用いた混合ポアソン分布にて推定し、混合ポアソン分布にて推定されたCVR を事前分布の期待値とする制約を設けた階層モデルによって広告(クリエイティブ) のCVR を推定するモデルを示す。またCVR の推定に多く用いられるロジスティック回帰モデルと提案モデルを比較し、精度とロバスト性の比較を行う。 スナリバラフト ツイート中の地理情報に対する時間的極性の自動推定. 我々は,単語の埋め込みをベースにした畳込みニューラルネットワーク(CNN) を用いた分類モデルを提案する.さらに,CNN に,地名語に依存する特徴量や,形態論的な特徴量を導入することによって,性能の向上がはかれることを示す. スナリバラフト 言語能力の低い主体と共同活動をするための対話ストラテジー. そこで,大人と子供が対話をしながら共同で課題を遂行する場合,大人同士が課題を遂行する場合とどのような言語現象が異るかをコーパスを用いて明かにする. スナリバラフト 音楽番組におけるカット割りの計量修辞学的分析. 本報告は,その結果に基づいて,分布に対して相補的な分析対象となるカットのつなぎ,即ちカットの連辞的連鎖に焦点を当て,音楽番組の規範/偏差体系の計量的・修辞学的な分析を行う. スナリバラフト 文構造を考慮した発話理解に基づく自然文検索. 本論文では,自然文で入力されたクエリの意味を語順や係り受けといった文構造も含めてりかいすることによる自然文検索手法を提案する。クエリと検索対象文書中の単語や文節,係り受け表現の意味をすべて分散表現に変換し,ベクトル間の距離に基づく類似度により検索を行う. スナリバラフト 特許文献を利用した技術課題の抽象化方法の検討. そこで本研究では、企業の技術開発戦略の創出を支援する方法として、特許明細書の「発明が解決しようとする課題」「課題を解決するための手段」内の文書に基づいてクラスタリングを行うことにより、クラスタ内の特許文献に共通する技術課題を抽出することを目的とする。さらに、クラスタに共通する技術課題と、各特許文献の技術課題の内容が一目で把握できるよう可視化することを目的とする。 スナリバラフト 陸上競技ブログからの活動記録抽出と可視化. 本研究では,ブログサイトから抽出した活動内容を,ユーザの要求に応じた可視化を行うための提示手法を提案し,実データを用いた実験と考察について述べる. スナリバラフト コールセンターにおけるユーザ満足度の向上要因の抽出. 本研究では, コールセンターのお問合せデータをテキストマイニングにより分析し,ユーザ満足度の向上要因の抽出することを目的として実施した. スナリバラフト 物語の構造抽出のための慣用的表現の処理. そこで本研究においては,物語中の登場人物の言動とそれらによって生じる物語上の機能のみに焦点を絞って,どのような表現を分析できれば,登場人物の言動から構成される物語構造を実用的な精度で抽出可能であるか検討し,そのために必要な慣用的な表現の処理についてデータ構造と分析のアルゴリズムを提案する. スナリバラフト LDAの適用によるレビュー記事からの価値観モデリングに関する考察. そこで本稿では代表的なトピックモデルであるLDAを用いて,レビューで言及されている評価属性を抽出する手法を提案する.提案手法ではレビューから抽出したトピックを評価属性と見なし,その極性を評価極性辞書を用いて決定する.各レビューに対応した総合評価の極性と,抽出トピック(評価属性)の極性に基づき評価一致率を計算する.映画レビューサイトであるYahoo!映画1 に投稿されたレビュー集合に対して提案手法を適用し,抽出された評価属性の性質などについて考察する. スナリバラフト 評判情報抽出のための評価文型パターンの自動抽出についての考察. 本研究では,評価文型パターンを用いた評判分析を実現するために,評価文型パターンを分析対象となる文章データ群から自動的に抽出する手法について考察する. スナリバラフト 構文構造に着目した文体の類似度の数値化. 本研究では,部分木の出現頻度を反映する木カーネル,すなわち情報量木カーネルを定義し,作家間の特徴を表現する構造を取り出すことも試みる. スナリバラフト 構造化データとテキストデータを組合せた消費者の声分析. 本手法では、家庭向け【電力自由化】に関する 調査結果[マーシュ調べ]において、探索型多変量手法による選択問題の構造化データ分析と、テキスト分析による自由回答文の分析を組み合わせることで消費者の声を分析し、自宅の電力会社を変える意向が低い消費者の特徴を明らかにした。 スナリバラフト 位置情報付きツイートによる観光行動のモデル化. 本研究では,位置情報付きのツイートデータから,系列パターンマイニング手法を用い,ミクロな移動傾向および観光客の移動パターンを抽出する手法を提案する.提案手法から抽出した移動パターンを分析することにより,特定エリアにおける観光客の観覧傾向と観覧経路を把握することが可能であると考える. スナリバラフト データジャケットにおける変数ラベルの共起性を考慮した変数ラベル推定手法の検討. 本研究では,DJ に含まれる概要と変数に関する情報(変数ラベル)から変数ラベルの共起性に着目し,2 つのモデルについて考察する.そして,変数に関する情報を含まないデータの概要情報から,そのデータに含まれる可能性のある変数ラベルを推定する方法を提案する.変数名や変数に関する情報が含まれていなくても,データの概要情報から変数ラベルを推定することで,データ同士の潜在的な結合可能性を意思決定者に提示できれば,データ利活用を促すことが可能となる.また,新たにデータを取得し,意思決定に役立てたいと考えるプレイヤーに対し,どのような変数を取得することが意思決定において重要であるのかという知見を示すことができる. スナリバラフト 局所ヒストグラム法の拡張によるサムネイル画像のタグ付け. 本研究ではこの問題に対して,網羅性・識別性の評価をタグの組み合わせに対して行うことでタグの関連性を扱うように局所ヒストグラム法を拡張する.加えて,画像毎に評価の高いパターンを特定することで,データのスパース性に対処する.これらの拡張により,より精度の高い分類が期待できる. スナリバラフト アンサンブル木学習によるノンパラメトリックなセンサー値正常範囲推定. 本稿ではAdaptive Limit Checking の手法をもとに、学習のアンサンブル化や時間的文脈情報の抽出・利用を行うことでこ れらの問題を解決できないか検討する。 スナリバラフト 人間の行動やことばから、どのように「老い」を判断するか?. 本論文では、インタビュイーの語り方の特徴について分析する.更に、インタビュアーはどのように質問したり誘導したりするのがふさわしいかについても検討する. スナリバラフト 逐次的な差分に基づく複数時系列文書要約への取り組み. 本研究ではそのことを踏まえて,複数の新聞社による長期にわたる記事を一つにまとめながら,数日前には無かった新しく追加された情報に重きを置いた要約文を時系列順に生成する手法を提案する. スナリバラフト 日本における居住地推定のためのソーシャルネットワーク作成方法の調査. 本研究では、ソーシャルネットワークの作成方法または居住地推定手法を変えて、居住地推定をおこなうシステムを作成する。このシステムにより、日本のTwitter データから作成したソーシャルネットワークに複数の居住地推定手法を適用した結果を評価する。さらに、利用するユーザ間の関係を変えて作成した複数のソーシャルネットワークを利用し、居住地推定に最も有効なユーザ間の関係を特定する。先行研究で利用されている相互フォロー関係から作成したソーシャルネットワークは、居住地推定において、必ずしも良い性能を発揮しないことを示す。また、繰り返し推定手法を適用するときの性能を明らかにする。 スナリバラフト 位置情報付きツイートを用いたユーザ属性推定と地域クラスタリング. そこで本研究では,位置情報とツイートの内容の両方のデータを用いて,地域の特徴付けを行った.はじめにツイートの内容を分析することで,ユーザの属性を推定するモデルを構築した.具体的には,テキストを形態素解析し,ユーザごとに特徴的な単語の出現回数行列を作成することで,属性を推定する分類器を作成した.次に,このモデルにより推定したユーザ属性をもとに,地域の特徴を抽出し,クラスタリングを行った.このようにユーザの属性を使った地域クラスタリングを行うことで,細かいエリアごとのマーケティング戦略の立案に活かすことが出来る. スナリバラフト レビューテキストを対象としたハイブリッド型推薦手法におけるトピックモデルの有効性について. 本研究の目的は,書籍を対象とした推薦システムの評価値予測タスクにおいて,推薦精度を向上させることである.そこで,本稿では,「内容の似ている書籍は類似した評価値を付与される」という仮説のもと,評価値予測のタスクにおいて,書籍のレビューテキストにトピックモデルを適用することで書籍の内容を反映させたアイテム間の類似度を用いるハイブリッド型推薦手法を提案し,評価値予測の精度向上を試みる.トピックモデルは潜在的意味(トピック)を扱うことが可能なため,書籍のレビューテキストにおいて表層には出現しない情報を利用することができる. スナリバラフト 分析成果の業務活用とモデルの解釈性についての一考察. 本論文では,まず分析結果の根拠などを記載した分析成果レポートについて説明する.次に,レポートにより分析結果の根拠に対する納得感が得られるか否かを評価する.さらに,根拠に対する納得感が分析結果の活用に与える影響を明らかにする. スナリバラフト BCCWJ におけるオノマトペの語義とコロケーションの分析. そこで,本研究は共起語が属する格とオノマトペの語義との関係についての傾向を明らかにすることを目的とする. スナリバラフト RNNを利用したコンテンツ産業の消費トレンド予測. 以上の背景から本研究では,ウェブマイニングにより得た素性に対してRNN を適用し,トレンド予測を行う手法を提案する.具体的には,幅広い作品を網羅するWikipedia から得られる素性とTwitter から得られる素性を組み合わせ,オンラインショッピングサイトにおける日次の販売ランキングをもとにトレンドの予測を行う. スナリバラフト ライフログ利用履歴とユーザ群クラスタリングを用いた非Twitter ユーザのプロファイリング. 本研究では、あるコンテンツを推薦するサービスにおいて、他のSNS を利用していないユーザに対し、当該ユーザの過去の履歴を利用することで、SNS を利用しているユーザと同様のプロファイル情報を与えることを目的とする。今回は我々の研究室が企業と共同で開発を行っているコンテンツ推薦サービスであるFourDiary をモデルケースとして利用し、SNS としてTwitter を対象に考える。提案手法ではまず、Twitter を利用しているユーザをフォロー数、フォロワー数などの関連情報によって構成されたベクトルでクラスタリングする。つぎに、FourDiary のユーザの非Twitter ユーザを選択すれば、そのユーザのFourDiary の履歴と、クラスタリングされたTwitter ユーザのFourDiary の履歴を比較し、最も類似しているクラスタのセントロイドをユーザの特性を表すプロファイルとして付与する手法を提案する。 スナリバラフト ウェブサイトのユーザ遷移に基づいたコンバージョン促進要因の抽出. そこで本研究では,経路によるユーザの知覚の可視化手法を提案する.Google Analytics で取得したデータとウェブページをクローリングして得られたデータを元に経路別で得られるユーザの知覚を可視化することで,単純なコンバージョンではなく,コンバージョンの原因となった知覚の特定やコンバージョンの改善に繋がる具体的な施策が打ちやすくなる可能性を示唆する. スナリバラフト 部分転置ダブルアレイを用いたngram 言語モデルの検討. 本稿では、DALM のモデルパラメータとインデックスの配列を分離することにより、量子化による効率的な圧縮を可能とするデータ構造を検討する。まず基本的な構造を検討し、実際のデータに基づく性質を調べた後、配列を分離したDALMのサイズを小さくするために使える「部分転置ダブル配列」を提案する。評価実験により、提案手法はbase 配列に関して約40%の削減が可能であることを示す。 スナリバラフト 語順を基にした分散的意味表現による観光文書表現の検証. 本論文ではまず、この観光推薦の発展のために、Doc2ec により観光文書の表現ベクトルを学習し、ベクトルが記事の内容を適切に反映しているか、つまり、似た記事のベクトル同士は類似度が高くなっているかを検証した。本実験ではデータとして、あらかじめ人手により記事の属性を表すタグを付与された観光キュレーションデータを用い、Doc2Vec により各記事の表現ベクトルを獲得した。このとき、似た記事同士は、似たベクトルを持ちクラスタを作っているはずである。そこでK-means 法によりクラスタリングを行い、同じタグを持つ記事同士が同じクラスタ内に属することを検証した。また、クラスタ内の記事の内容を実際に見比べることにより、実際に似た記事同士でクラスタを作っているかを定性的にも評価した。 スナリバラフト メタファーはどのように特定するのか. そこで本稿では、言語学的アプローチとしてMPA,とMIP(VU)を、さらに工学的アプローチとしてはその中でも特に先駆的な役割を担うと思われるMet*とCorMet を取り上げ、それぞれの手法を確認するとともに、それらを鳥瞰図的な視点から比較検討し、分野間、手法間の類似点、相違点について論じる。 スナリバラフト 語の並びにおける順序制約. 本稿では、鍋島(2004、2006)にならい、より多くの言語のデータを集め、語の並びにおける意味的制約を観察し、そこから見出した言語間の共通性や差異を明らかにする。 スナリバラフト 依存型意味論における型チェックの実装の試み. 本論文では、定式化された新たなDTS のための型チェック・型推論アルゴリズムの実装し、このアルゴリズムによって橋渡し照応を含む様々な照応現象を自動的に計算することが可能であることを示す。 スナリバラフト 流行表現の原形推定に基づく由来検索システム. 本稿では,Web ブラウジング中に発見した流行表現に対して,流行表現の原形を推定する手法およびそれを利用した流行表現の由来を検索するシステムの実装について述べる.本研究では,レーベンシュタイン距離とJaccard 係数およびDice 係数により表現同士の類似度を計算することで,その表現の原形を推定する.本稿では,人手で抽出した流行表現と思われる表現について本システムを使用して実験を行い,その結果と考察について述べる. スナリバラフト コンテキストを考慮した非タスク指向型対話システムの構築. 本研究では先行研究と同様,Web 上の情報を用いて取得した応答文を利用する手法とルールベース方式を組み合わせた対話システムを提案する. スナリバラフト Closed class に着目した教師なし品詞タグ推定性能向上の検討. 本研究では,明示的にクローズドクラスに着目することが教師なし品詞タグ推定に与える影響を確かめるべく,上述の点に着目した手法をベースとなるHMM に組み込む実験を行った.ベースとなるHMM のパラメータ学習手法は,CollapsedVariational Bayes(CVB) 法とした. スナリバラフト サジェストおよびトピックモデルを用いた多様な話題のウェブページの選択的収集. 本論文では,トピックモデルの一種である潜在的ディリクレ配分法(LDA: Latent Dirichlet Allocation) を用いた話題集約の手法を提案する. スナリバラフト 絵本レビューにおける子どもの認知発達的反応を用いた絵本分類結果の分析. 本論文では,絵本の内容と子どもの認知発達的反応の関係を明らかにすることを目的とする.具体的には,子どもの認知発達的反応を表す7 表現を選定し,これらの表現が絵本ナビのレビュー中に一定以上存在する絵本を対象として,表現の頻度を用いて絵本をベクトルで表すことにより,絵本のクラスタリングを行う.そして,クラスタリング結果を用いて,その絵本に対して子どもがどのような反応をするか,という観点から絵本を分類する.また,絵本情報サイト「絵本ナビ」における「絵本のテーマ」とクラスタの重複について分析を行い,一定以上の重複があるテーマのうち,絵本の内容を表すものを選定し,絵本の分類との関係について調査した結果を述べる. スナリバラフト 外国人名カタカナ表記自動推定における各国適応. このような背景により,我々は,2015 年度よりコンピュータ支援による外国人名カタカナ表記の標準化・統一化に関する研究を開始し,すでに,基盤となる自動トランスリタレーションシステム(ベースシステム) を開発した.本稿では,このシステムの各国適応の試みについて報告する. スナリバラフト オープンドメインな情報提供のためのzero-shot 学習に基づく自然言語理解. 本稿では上記の課題を解決する新たなzero-shot 学習を提案する.提案手法の特徴は,異なるドメイン間でも頑健に自然言語理解を行うために,ドメイン間で共通性を持つ汎用的な質問タイプをzero-shot 学習の新たな素性として導入する点,そして,知識ベースの構造と自然文中の系列に則した系列ラベリングを可能とした点,の2 点である.提案手法を評価するために,異なる2つのドメイン(観光と保険ドメイン)間で実験を行い,ベースラインと比較して精度を改善したことを示す. スナリバラフト TRPG 方式に基づく物語自動生成ゲームにおける場面連鎖拡張機構の試作. Table-top Role Playing Game (TRPG)の方式と物語生成とを融合したゲーム方式物語生成システムもしくは物語生成方式ゲームの開発に着手している.物語生成システムとしては,開発中の統合物語生成システム(Integrated Narrative Generation System: INGS)を組み込む.本稿ではその詳細説明は省略するので,上記文献を参照されたい.システムはINGS を利用するが,INGS にもまた将来的にここで開発された方式,多人数(人間及びコンピュータエージェント)による物語生成の実現等を取り込んで行く予定である.これまでシステム全体のアーキテクチャの考案作業を進めて来たが,今後はシステムの特定部分の試作的な実装を通じて全体の一応の完成を目指す.ここでは,システムにおける物語生成に関連する一機構である「場面連鎖拡張機構」を対象に簡単な試作システムを開発する. スナリバラフト 英語センター試験「未知語語義推定問題」解答のための評価尺度について. 本研究ではこの語義推定問題の解法について2つの方向から検討を行う.一つ目は我々の提案した手法の改良であり,二つ目は新たな同義性尺度の適用である.前者については英語辞書(英英辞典)の語義説明文を利用して元の表現をパラフレーズすることにより,同義性の認識漏れの低減を目指す.後者については,含意関係認識や翻訳評価などの分野で提案されている「言語表現間の意味的同値性・類似性を評価する尺度」などの適用を試みる.これらの尺度はそれぞれの分野でその有効性が示されているが,一定量(約100 問) の大学入試問題に適用してその有効性を評価することには大きな意味がある. スナリバラフト 物語生成のための事象間の結合属性の分類,物語論的観点からの検討. 物語は,現実であるか虚構であるかに拘わらず,諸々の事象を表現する人間にとって普遍的な方法・形式である.人工知能研究においても,物語生成は重要な課題の一つとして取り組まれてきた.人間の物語は,事象を生起した順序通りに機械的に羅列するだけではなく,様々な方法で筋立てて語られる.本研究の目標は,コンピュータに柔軟な筋立て能力を実装するための,基礎的な理論・枠組みを設計することである. スナリバラフト 「尽し」の物語生成,歌舞伎等の調査とINGS における固有名詞概念辞書の開発による実現へ. 筆者の計画を大雑把に言えば,その物語や舞台の創出・制作機構全般を対象に,物語において特徴的な修辞や技法に関して,特に知識の多重性に着目して調査・分析を行い,その知見を開発中の統合物語生成システム(Integrated Narrative Generation System:以下INGS)における機構や知識に導入し,さらにこのシステムを利用した社会的流通を視野に入れた芸能情報システム(Geino InformationSystem: 以下GIS)に結び付けることである. スナリバラフト Twitter データに基づく関心事項提示システム. SNS のデータを利用し,コミュニケーション相手の関心を事前に調査,円滑な雑談を遂行するための補助システムを構築することを本研究の目的とする.本システムでは,コミュニケーション相手の関心を提示し,併せて種々の関連情報を提供することで,会話準備のコスト削減を行う. スナリバラフト 製品名と特許における名称の言い換え知識の抽出. そこで我々は,製品名称に対する特許文書中での言い換え表現の辞書作成を目的とする.しかしながら,人手によって特許文書中から言い換え表現を探すのは難しいこと加え,言い換え表現の候補も数多く存在することから,自動的に辞書を構築するのは困難である.そのため,本研究では,製品名称に対する言い換え表現の候補を自動的に抽出する技術を開発する.言い換え表現の候補に言い換え表現らしさを示すスコアを付与し,スコアの上位に言い換え表現が存在すれば,人手によって容易に言い換え表現の辞書を構築できるようになる. スナリバラフト データ追加に基づく独立話題分析の提案. そこで本報告では,データが増加する度に全ての文書データを用いるのではなく,増加したデータだけを用いる,データ追加に基づく独立話題分析を提案する. スナリバラフト 言語モデルを用いたウェブメディアの特徴抽出. 本研究ではウェブメディアの記事にAuthor TopicModelを適用しメディアごとの特徴を抽出し分析することを試みる.各メディアがどのようなメディアかということはこれまで主観的に述べられてきた.言語モデルを用いることでメディアごとの特性を客観的に分析することにより,現在の市場環境の可視化や,想定されるユーザ層の分析,競合分析などが行えると期待される. スナリバラフト 題材となるオブジェクトの抽象化による確率文章題の自動解答. これに対し本稿では,題材となるオブジェクトを限定せずに中間表現を生成する手法について検討する.この手法では,題材となるオブジェクトを推定し,それをもとに問題文にタグを付与して問題文を抽象化する.これにより,題材となるオブジェクトや試行を表す表記の違いによらず,中間表現を生成することができる. スナリバラフト 大規模論文データからの異種ネットワーク組み合わせによる萌芽論文の推定. 本研究では,任意の学術分野における萌芽論文の早期特定を目的とし,引用ネットワーク特徴量抽象化による萌芽論文予測の分野横断適用手法の提案と評価を行う. スナリバラフト ストーリー展開と一貫性を同時に考慮した歌詞生成モデル. 本研究では歌詞の内容を重要視した作詞支援システム実現への第一歩として,一貫したテーマとストーリー展開を考慮したモデルを提案する. 実験では,歌詞内のブロックを正しい順序に並べるタスクを行い,提案モデルが楽曲のストーリー展開をモデル化する上で優れていることを示した.さらに「作詞におけるテーマ・ストーリー展開の重要性」を確認するために,学習されたモデルを定性的に分析した. スナリバラフト facet-biased トピックモデルと距離尺度学習を用いたニュース記事の分類. 本研究では、ニュース記事の分類においては、芸能人やチーム名といった固有名や、日本の地名か外国の地名などの存在が重要な役割を果たすことに注目し、人名・地名・組織名というfacet を考え、全体のトピック群が人名とその関連語を生成するトピック、地名とその関連語を生成するトピック、組織名とその関連語を生成するトピック、その他の語を生成するトピックから構成されると仮定したモデルを生成する。また、Yahoo! Newsからクロールしたデータを用いて分類実験を行い、本システムの有効性を検討する。 スナリバラフト ディベート人工知能における影響関係認識のためのテキスト内の論理構造に関する考察. 本稿では,作用関係を認識するのに有効なパターンにどのようなものがあるかを検討する。まず作用述語を用いた基本パターンにより作用関係の認識を試みる。次に,再現率を上げるため,基本パターンでは認識できなかった作用関係の文について,どのようなパターンが含まれるかの分析を行う。そこから,作用関係認識において必要となるパターンや知識資源はどのようなものであるかを議論する。 スナリバラフト キャラクターを用いたテキストマイニングツールの利用意欲の促進. そこで本研究では, アシストキャラクターに着目し, キャラクターを用いた適切なアシストを行うことで, ユーザのアプリケーション利用意欲の向上を図る. 本研究では, テキストマイニングツール「TETDM」を題材として, キャラクターを用いることで利用者の意欲向上を図り,テキストマイニングスキルの習得・向上を目指していく. スナリバラフト 大規模コーパスを用いたWord2vec による比喩の書き換え. 本研究は、自然言語処理という研究分野に対して以下のような貢献をした。まず、喩辞と被喩辞が明示された比喩表現の書き換えというタスクに対して、Word2vec を初めて用いたことである。本研究ではWord2vec を適用することによって多くの単語が書き換え可能になったメリットとともに、Word2vecを適用したことによる問題点もみられた。次に、比喩の書き換えという古くからあるタスクに対して、最新のRNNLM の適用可能性を示したことである。結果はうまくいかなかったが、パラメータの調整やRNNLM モデルの拡張によって精度の向上の可能性が有る。 スナリバラフト 語句出現頻度を利用した公開特許からの課題・手段推定システムの検討. 以上の背景から,本稿では次のような修正を加えた手法を提案する.一つ目の修正としては,課題・手段分類のために用いる語句の抽出範囲を,従来の特許公報のブロックごとから,特許公報の要約に変更する.これは,他のブロックから抽出されるノイズとなる語を軽減することと,計算量の削減が目的である.二つ目としては,出現回数のカウント方法を,従来のブロック単位ではなく,特許公報全体とする.これは,ブロック単位で行った場合に値の差が小さくなる傾向があったため,それを押さえ,識別率を挙げることが目的である.三つ目として,抽出を試みる課題や手段の分類を出現数に基づき統合する.これにより候補が絞り込め,精度があがることが期待できる. スナリバラフト オンライン広告におけるウェブ閲覧系列の分散表現の獲得. 本稿では,まず我々のアプローチの概要を述べ,続いて学習データ量を変化させた時の,予測タスクの性能の変化について報告する. スナリバラフト 街のテクストを生成する試み. 本研究は,物語テクストの出現地点を現実世界に求め,路面電車の停留所や旅行者等の移動ルートを順序付けて生成される痕跡を広義のテクストと考える.コンテンツの中に描かれてテクスト化された街は,ユーザーが地理空間情報によって場所を特定し,テクストと場所を一致させるとともに次の目的地として移動のためのアンカーにもなる. スナリバラフト 絵本レビューを情報源とする子どもの認知発達的現象の観察と分析. 本論文では,絵本読み聞かせレビューテキストから収集した大規模な指差し事例,および,発話事例を分析することにより,従来の絵本読み聞かせ実証研究の知見を改めて検証するとともに,従来十分に実証されていなかった特徴についての分析も併せて行う.次に,絵本レビューを情報源とする分析結果に対して,言語発達研究からの知見に基づく説明を行うことによって,指差し行動特徴の観点から,絵本の読み聞かせと言語発達との間の密接な関係を明らかにする.