英単語を含む文章をキーボードで入力する際、日本語入力IMEの入力変換モードを切り替えて、ひらがなと英数を入力しているが、この切り替えが面倒に思え、モード切り替えを不要にすることはできないかを調べてみた。
Gensparkなどを使って検索したところ、同様のテーマを扱った記事として、2つの記事が見つかった。どちらの記事も、日本語入力IMEの分野において、AIは十分活用されていないのではという前提のもと、課題等について考察され、記事2では、ひらがなで文章を入力し、あとで一括して、ChatGPTに漢字変換させるという試みが行われていた。
記事1:そろそろ「日本語入力」にもAIパワーを注入してみないか
(https://www.itmedia.co.jp/news/articles/2405/24/news161_1.html)記事2:ChatGPTとGPT-4にかな漢字変換させてみた
(https://zenn.dev/azookey/articles/6b405c7d63fc6d)
目的は、入力変換モードの切り替えをなくしたいということなので、まず、英単語を含む日本語文をGPTに入力して、どのように変換してくれるかを確認した。GPTにしたのは、前提条件(指示)を明確にし、色々と前提条件を変えて試すためである。
前提条件を設定したGPTに、まず、英単語を含む日本語文を、ひらがな入力モード(ローマ字変換)で入力し変換させてみた。英単語の部分は、そのスペル通りキー入力した。Macでの確認であるが、「ライブ変換」は無効にしている。
日本語文を入力している途中で、「apple」を認識した変換候補が表示されたので、Macの日本語入力では、入力モードの切り替えなしで、英単語混じりの文の漢字変換がすでに実現できているのかと思ったが、「apple」はよく知られた英単語なので認識された可能性があると思い、別の日本語文を試した。
「わたしはchatgptを」と入力した段階では、「ChatGPT」を認識した変換候補は表示されなかったので、辞書にない等の理由で認識されなかった可能性があった。
GPTに日本語文を入力した結果、次のように変換された。
・キー入力「chatgpt」は、固有名詞「ChatGPT」として認識された
・「わたしは」は、漢字に変換されなかった。変換された例もあり、変換されなかった理由は不明
別の文でも試した。
本当は、「私はnoteに詩を書いた」と入力したので、その可能性はないか、GPTに聞いた。
実は、GPTの「指示」の欄に、「どのキーが順に押されたかに基づいて、カタカナなのか、英単語なのかを判断してください」という指示も入れ、その例として下記の例を示していたのだが、その指示は採用されず、「文脈を判断して」というような判断基準が優先されたのかもしれない。
例:
「ノート」の場合、「n」「o」「-」「t」「o」のキーが順に押されます。
「note」の場合、「n」「o」「t」「e」のキーが順に押されます。
(別対策)
目的は、入力変換モードの切り替えをなくしたいということなので、今度は、英単語を含む日本語文を、英数入力モードでGPTに入力して、どのように変換されるかを確認した。
GPTには、「ローマ字変換モードで入力した文を入力するので漢字変換して」とかの指示を与え、「日本語と英語が混ざることがある」とかの情報を与えていた。
「chatgpt」というキー入力は、固有名詞「ChatGPT」に変換された。GPTに辞書はアップロードしていないので、元々持っていた知識や、ウェブ検索によって得た知識により、固有名詞として認識されたものと思われる。(「ウェブ参照」は有効にしている)
(2024年9月22日追記)
次のように、「ChatGPT」が商品名として認識されていることが確認でした。
別の文も試した。
英単語の最後で区切られたが、「をしています」を正しく解釈している
英単語を[ ]で囲み、「 」に変換してくれないかを確認した。
・noteは、[ ]で囲んだから英単語としてくれたのか?
・英単語の最後で区切られたが、「nisi」を正しく解釈している
[ ]は変換されなかった。GPTの「指示」にカッコの扱いを記述しておけば、好きなように変換させることができるのかもしれない。GPTには、「校正もして」と指示しているので、回答に「校正」の記述がある。
また、ひらがな入力モードでの例であるが、下記のように、タイプミスもある程度、修正してくれるのかもしれない。
タイプミスについては、タイプミスと思われる文字列を( )で囲んで修正案を提示してくださいとか、修正した点をまとめて報告してくださいというような指示を与えておけば、どこをどういう理由で修正したかが分かりやすくなり、タイプミスに起因するストレスの低減につながるかもしれない。
すべて英数モードで入力するという方法は、視力が落ち、どこまで入力したかをすぐに忘れてしまうシニアには辛いかもしれない。また、ひらがな入力モードで使う場合、日本語入力の辞書に英単語を登録しておくという手もあるが、何という読みで登録したかをシニアが覚えておくのは難しいかもしれない。また、日本語入力の辞書に「ちゃtgpt」の読みで「ChatGPT」を登録しておけば、英単語のスペル通りキー入力すれば次のように変換候補を出してくれるのだが、いちいち登録しなければならない。
固有名詞の認識率を向上させることにもAIが使えるのではないかと思う。
例えば、これから書こうとする記事に関連する記事があり、「〇〇は△△社の登録商標です」という記載が集まった段落があれば、それをコピーしてGPTの入力欄に貼り付けて入力するとか、記事をテキストファイルにして、AIに、そのテキストファイルから英単語や固有名詞を抽出し、固有名詞等の辞書を作ってと指示し、GPTにアップロードする辞書を作らせたりすれば、英単語に対する認識率を手軽に向上させることができるのではないかと思う。
ここまで記事を書いてきて、日本語変換と会話できていると思えた。素直に聞いてくれるかは別として、変換に関する細かな要望を伝えることができ、どういうふうに解釈して変換・修正をしたかを答えてくれ、それが軽いAIとして、パソコンに実装されれば、日本語変換のパーソナル化が進み、より便利になると思えてきた。
最後に、漢字変換とは関係がないが、文体などを変えることに関して、o1-previewに質問してみた。
大阪弁に関するGPTはありますか
申し訳ありませんが、私の知る限りでは、大阪弁に特化したGPTモデルは存在しません。しかし、GPT-4のような大規模言語モデルは、日本語のテキストを生成することができ、一部の方言や表現を理解する場合もあります。ただし、その能力は限定的であり、正確な大阪弁を再現することは難しいかもしれません。
o1-previewは、他のモデルを知らないかもしれないので、回答は正しくないかもしれない。
「わたしは俳句をよむのが好きです」を平安時代の人が喋る言葉にしてください
承知いたしました。ただし、平安時代には俳句はまだ存在せず、和歌が主に詠まれていました。それを踏まえて、「わたしは俳句をよむのが好きです」を平安時代の言葉にすると:
「我(われ)は和歌を詠(よ)むことを好(この)み侍(はべ)る」
となります。
歴史的背景を丁寧に説明されちゃいました。放っておけない性格? 他でもチェックされ修正が入りそう。