AI×IoT×ビッグデータ技術 エンジニアのテックブログ

人工知能(AI)やIoT、ビッグデータ技術に関連する「技術書、Eラーニング、事例、勉強会」などでのテックブログです。

チャットボットをDeepLearningで開発するには

結構当たり前の話ですが、RNN系の実装のseq2seqモデルで、学習データを食わせるわけですが、単純な実装だとダメです。

そこで、attention seq2seqの登場です。

でも、それだけではまだダメです。

 

そこで、インテント単位の中身をBoWとかWord2Vecでベクトル的に値化したり、

単語をkuromojiなどで、分解して、この名詞は苗字らしいとかもわかるようにして

よりコンテキストを理解していきます。

そうすることで、FAQ応答などのユースケースはある程度の精度が出てきます。

 

ただ、学習データは良質にしていくこと、モデルも業務の内容に合わせて

チューニングしていかないと、軽量で良い分解をしてくれるようなスケーラブルなモデルにならないので、エンジニア自身がFAQの中身を理解していく必要が出てきます。

結局そこが質的な差になって行くので、クライアントの気持ちを分かれるかが運命の分かれ道かもしれません。

 

それでもダメなら、下記のようにモデルをビジュアル化して、より中身を理解すると良さそうです。

projector.tensorflow.org