publish 関連研究をあらかた書いた

gomadoufu · Oct 26, 2023 · 5611399 · 5611399
1 parent 3426b3d
commit 5611399
Show file tree

Hide file tree

Showing 3 changed files with 111 additions and 14 deletions.
diff --git a/bib-volp.bib b/bib-volp.bib
@@ -0,0 +1,69 @@
+@techreport{hohoemi-service,
+   author	 = "中茂,睦裕 and 玉木,秀和 and 東野,豪 and 小林,稔",
+   title	 = "非同期コミュニケーションを促進する微笑み通信メディアの評価",
+   year 	 = "2010",
+   institution	 = "エヌ・ティ・ティ・コミュニケーションズ株式会社, 日本電信電話株式会社NTTサイバーソリューション研究所, 日本電信電話株式会社NTTサイバーソリューション研究所, 日本電信電話株式会社NTTサイバーソリューション研究所",
+   number	 = "6",
+   month	 = "jul"
+}
+@misc{voice-notes,
+        author  = "Shirin Ghaffary",
+        title   = "Why all your friends are sending you voice notes",
+        howpublished    = "\url{https://www.vox.com/technology/23665101/voice-message-whatsapp-apple-text}",
+        year    = "2023",
+        month = "apr"
+}
+@article{tsubuyaki-service,
+  title={音声つぶやきによる看護・介護サービスの記録・連携支援(&lt;特集&gt;介護・医療システムの現場参加型開発)},
+  author={内平 直志},
+  journal={人工知能},
+  volume={28},
+  number={6},
+  pages={893-898},
+  year={2013},
+  doi={10.11517/jjsai.28.6_893}
+}
+@techreport{asynchronous-message,
+   author	 = "幸英浩 and 西本,卓也 and 新美,康永",
+   title	 = "非同期型音声メッセージシステムの提案",
+   year 	 = "1998",
+   institution	 = "京都工芸繊維大学工芸学部電子情報工学科, 京都工芸繊維大学工芸学部電子情報工学科, 京都工芸繊維大学工芸学部電子情報工学科",
+   number	 = "68(1998-SLP-022)",
+   month	 = "jul"
+}
+@article{1050282813401063936,
+author="辻田, 眸 and 川原, 夕季 and 塚田, 浩二 and 椎尾, 一郎",
+title="時差を考慮した遠隔コミュニケーション支援システム",
+journal="情報処理学会研究報告. UBI, ユビキタスコンピューティングシステム",
+ISSN="09196072",
+publisher="情報処理学会",
+year="2011",
+month="05",
+volume="2011-UBI-30",
+number="7",
+pages="1-6",
+URL="https://cir.nii.ac.jp/crid/1050282813401063936"
+}
+@Book{white_paper_infor_commun_japan,
+  author =       "総務省",
+  title =        "令和元年版 情報通信白書",
+  publisher =    "日本政府",
+  note = "第1部 第1節 インターネットの発展・普及はコミュニケーションをどのように変えたのか",
+  year =         "2019"
+}
+@techreport{weko_37223_1,
+   author	 = "脇田,敏裕 and 長屋,隆之 and 寺嶌立太",
+   title	 = "2次元コードを用いたWWWと紙メディアとの融合の試み",
+   year 	 = "1998",
+   institution	 = "豊田中央研究所 ソフトウエア研究室, 豊田中央研究所 ソフトウエア研究室, 豊田中央研究所 ソフトウエア研究室",
+   number	 = "9(1997-HI-076)",
+   month	 = "jan"
+}
+@techreport{weko_99572_1,
+   author	 = "古本,啓祐 and 森井,昌克",
+   title	 = "多値二次元コードを利用した視覚障害者に対する音声支援",
+   year 	 = "2014",
+   institution	 = "神戸大学大学院工学研究科, 神戸大学大学院工学研究科",
+   number	 = "13",
+   month	 = "mar"
+}
diff --git a/tech-volp.tex b/tech-volp.tex
@@ -14,6 +14,9 @@
 \usepackage[dvips]{graphicx}
 \usepackage{latexsym}
 
+% bibtex用
+\usepackage{url}
+
 \def\Underline{\setbox0\hbox\bgroup\let\\\endUnderline}
 \def\endUnderline{\vphantom{y}\egroup\smash{\underline{\box0}}\\}
 \def\|{\verb|}
@@ -22,19 +25,18 @@
 \begin{document}
 
 
-\title{空間音声ラベルプリンタ：非同期の音声コミュニケーション促進を実現する小型印刷機を備えたIoTノード}
+\title{VoLP: 非同期音声コミュニケーション促進のための\\IoTノード}
 
 \affiliate{TDU}{東京電機大学}
 \author{橋本 慶紀}{Hashimoto Yoshiki}{TDU}[[email protected]]
 \author{岩井 将行}{Iwai Masayuki}{TDU}[[email protected]]
 
 \begin{abstract}
-近年、ボイスメッセージの利用が広がりを見せている一方で、モバイル端末に不慣れな人々は非同期音声コミュニケーションを十分活用できていない。このデジタルディバイドの問題を解決するため、本研究ではIoTノード「声ラベルプリンタ」を提案する。これは、クラウド上の録音メッセージを紙に印刷したQRコードを通じて提供するもので、専用アプリケーションのインストールやネットワークサービスの利用なしに、直感的かつ簡単に非同期音声コミュニケーションを活用できるようになる。本稿では、上記システムの実装の詳細と、それを用いた使用シナリオを検討する。
-\cite{weko_70056_1}
+近年、ボイスメッセージの利用が広がりを見せている一方で、モバイル端末に不慣れな人々は非同期音声コミュニケーションを十分活用できていない。この問題を解決するため、本研究では非同期コミュニケーションのためのIoTノードVoLPを提案する。VoLPは録音データへのアクセスを、印刷したQRコードとして提供する。これにより、専用アプリケーションや専用サービスの利用を必要とせず、直感的かつ簡単に非同期音声コミュニケーションを活用できるようになる。本稿では、上記IoTノードの実装の詳細と、それを用いた使用シナリオを検討する。
 \end{abstract}
 
 \begin{jkeyword}
-情報処理学会論文誌ジャーナル，\LaTeX，スタイルファイル，べからず集
+非同期, 音声コミュニケーション, IoT
 \end{jkeyword}
 
 \maketitle
@@ -44,6 +46,13 @@ \section{はじめに}
 
 % 論文フォーマットに関しては，\ref{sec:format}~章で後述する指針に従って頂くが，
 
+コミュニケーションは、同期コミュニケーションと非同期コミュニケーションに分けられる。双方が利点・欠点を持っており、我々は日常生活においてコミュニケーションの同期・非同期を使い分けている。\par
+たとえば非同期コミュニケーションには、送信者・受信者の双方がコミュニケーションするタイミングを合わせる必要がないという利点がある。そのため、非同期コミュニケーションが際立って効果的な場面というのがいくつかある。携帯電話・スマートフォンをはじめとする小型端末が普及した現在、非同期コミュニケーションは、以前より頻繁に用いられている。SNSでの日常的なテキストチャットや、大学におけるオンデマンド授業がその例である。\par
+非同期コミュニケーションのうち、特に音声コミュニケーションは、メッセージアプリケーションのボイスメッセージとして手軽に利用できる。特に若い世代を中心に積極的な利用の兆しがある。一方で、デジタル機器を利用していなかったり、使い方がわからないなどの理由でデジタル機器の利用が難しい人は、そのような非同期の音声コミュニケーションを手軽に利用することができない状況にある。幼い子供がいる家庭や高齢者施設など、音声のもつ息遣いや抑揚の情報がコミュニケーションに効果的に作用すると思われる場所は多くあるが、前述の理由のため、これらの場所で非同期音声コミュニケーションが十分活用されていない。\par
+この問題を解決するために、著者らは、クラウド上に録音メッセージをアップロードし、そのデータへのアクセスを紙に印刷したQRコードで提供するシステム「空間音声ラベルプリンタ」を考案した。
+本システムを用いることで、専用アプリケーションの利用や会員登録などの複雑な操作なしに、直感的かつ簡単に非同期音声コミュニケーションを利用することができる。\par
+本稿では、上記システムの実装および、使用シナリオとして、ラベルをボードに複数貼り付ける場合と、物体それぞれに貼り付ける場合について検討した結果を述べる。
+
 %2
 \section{関連研究}
 
@@ -73,12 +82,26 @@ \subsection{非同期コミュニケーション}
 % \item \|tech-esample.tex:| 研究報告（英文）のサンプル
 % \end{enumerate}
 
+同期コミュニケーションと非同期コミュニケーションでは、コミュニケーションのありかたが自然と異なってくる。近年では、モバイル端末とインターネットの普及とともに、非同期型のコミュニケーションが急速に広がってきた。
+その中で非同期コミュニケーションには、同期コミュニケーションとは違った困難さが伴うこともわかってきている。そのためこれまでに、非同期コミュニケーションを支援する研究がいくつかある。
+時差のある遠隔地の間では、同期コミュニケーションよりも非同期コミュニケーションが適する。辻田らは、時差のある遠隔地の間で、相手の行動を時差の分だけずらして伝達することで、より有効な非同期コミュニケーションを実現するCU-Laterを提案した。これは時差をシステムで補正し、別の時間に同じ場所で行われていた行動の映像を表示することで、非同期コミュニケーションを促進するものである。
+同期コミュニケーションと非同期コミュニケーションの間の感覚的な差異が大きければ大きいほど、コミュニケーションの困難さも増大すると考えられる。音声コミュニケーションについては、文字のコミュニケーションと比べ、同期コミュニケーションと非同期コミュニケーションのギャップが大きいため、スムーズなコミュニケーションが難しくなってしまう。これに対し中茂らは、音声の聞き手役のアバターを配置し、音声情報から表情を自動生成することで、スムーズな非同期音声コミュニケーションが可能なのではないかと考えた。
+これらの研究は、非同期コミュニケーションがもつ問題を、補完的な映像を使って解決している。しかし映像を使った方法は、システムを構成するノードの操作を煩雑にするほか、コミュニケーションがノードの設置された狭い範囲に限定され、非同期コミュニケーションのもつ場所的・時間的な自由を十分活用できていない。本研究では映像は採用せず、非同期音声を補完するものとして印刷された紙メディアを使用している。紙メディアの印刷は時間が経っても失われにくく、また可搬性も高い。
+
 % 2.2
 \subsection{音声コミュニケーション}
-
+テキストのメッセージと異なり、音声メッセージには以下のような利点がある。
+\begin{enumerate}
+    \item キーボードや文字入力画面を操作する必要がない
+    \item テキストより、感情を相手に伝えやすい
+\end{enumerate}
+内平らは利点1に注目して、看護や介護の現場を支援するコミュニケーションシステム「音声つぶやきシステム」を開発した。[5] これはケアスタッフ間の連携の負担を、スマートフォンとサーバを組み合わせたシステムで支援するものである。この研究は行動型サービスを対象としているが、一般的にもっとも簡易で負担の少ないコミュニケーションは音声コミュニケーションであることを示唆している。利点2に注目した幸ら[6]は、音声メッセージの再生中に聞き手の応答音声を記録する非同期型音声メッセージシステムを提案した。このシステムでは声質や感情などの音声ならではの豊かな情報を保存しながら、自然な非同期コミュニケーションの実現を試みている。本研究でも音声メッセージがテキストメッセージに対してもつ利点に注目した。利点1を利用して、文字入力がおぼつかない幼い子供や、高齢者を含むキーボード入力が苦手な人たちに対し、より簡単で自然なコミュニケーションを提供する。また利点2を利用して、家族や親しい人の間でのスムーズなコミュニケーションを支援する。
 
 % 2.3
-\subsection{二次元コード}
+\subsection{二次元コードと紙メディアの利用}
+デンソーウェーブと豊田中央研究所が共同で開発した二次元コードは一般にQRコードと呼ばれ、本稿でもQRコードと表記している。
+QRコードを利用した研究はいくつかある。たとえば古本らは、視覚障害者に音声データを提供する目的で、符号化方式を工夫した多値二次元コードを提案している。この提案はQRコードを通じて音声を提供すると言う点で本研究と類似しているが、符号化方式が一般に用いられているQRコードと異なるため、QRコードから音声データを引き出すには専用のデコーダが必要という問題がある。
+ここ数年、決済目的でディスプレイに表示されて使用されることの多いQRコードだが、以前より紙に印刷されて使用されることも多かった。紙に印刷された二次元コードは、電子情報の持つデータ同士の結びつきを保ちながら、可搬性や実在性、高いアクセシビリティを持ち合わせる特異なメディアとなる。脇田らは電子メディアから紙メディアへの変換(印刷)の過程で失われるリンク情報などを二次元コードで補完できることに注目し、WWW上の情報と、紙メディア上の情報との融合を試みた。この研究は本研究と発想を同じくするが、本研究ではさらに、モバイル端末とクラウドサービスがもたらした、紙に印刷された二次元コードの持つアクセシビリティにも注目している。
 
 %3
 \section{既存の非同期音声システム}
@@ -530,6 +553,19 @@ \section{プロトタイプ実装}
 % また，A4横型に対するガイドを作成された当時の編集委員会の担当者に深謝する．
 % \end{acknowledgment}
 
+%7
+\section{利用シナリオの検討}
+本研究のIoTノードは、音声データへのURLを紙に印刷する。これは2 関連研究で調査した既存の提案にはない特徴的な性質である。この性質から、本IoTノードは以下のように利用方法が拡張される
+\begin{enumerate}
+    \item 声ラベルの余白に手書きすることで、音声データにメタデータを後から付与できる\\例: 声ラベルの余白に、誰に向けたメッセージなのか書き込む
+    \item 声ラベルが印刷された紙を、アノテーションしたい対象にテープなどで貼り付けることで、音声が説明する対象や音声の文脈などを、現実世界に表示できる \\例: 声ラベルが保持する音声の中で指示語を使い、何を指しているかをラベルを張ることで表示する
+    \item 声ラベルをホワイトボードや黒板に多数貼り付けることで、スペースのかぎり、音声データを間接的に一覧できる
+\end{enumerate}
+
+%8
+\section{おわりに}
+本研究では、非同期コミュニケーションを促進するためのIoTノードを提案した。そして、そのプロトタイプを設計・実装した。最後に、IoTノードの利用シナリオについて検討した。本IoTノードにより、非同期音声コミュニケーションの応用範囲が広がることが期待できる。今後は、このIoTノードを一般家庭や教育施設、高齢者施設に設置して、長期実証実験を行い、有効性を検証する予定である。
+
 \bibliographystyle{ipsjunsrt}
 \bibliography{volp} 
 \end{document}
diff --git a/volp.bib b/volp.bib