GPT-4oとo1-previewのひらがな処理要領調査

GPT-4は、ひらがなの扱いが苦手だったように思うので、o1-previewが公開されたこの機会にあらためて調べてみた。

下記の調査は、GPT-4o、o1-mini、GPT-4(レガシーモデル)を用いた例も含む。

日本語のひらがなで、物の名前の中に、同じひらがなが複数含まれるものを15個あげてください

以下は、同じひらがなが複数含まれる物の名前(ひらがな表記)です:
きつつき すすき かささぎ ふすま ささら つづみ すずむし はばたき こころ つばめ まんまる もも ささ ひひいろざる すいとう
これらは、同じひらがなが名前の中に複数含まれるものです。

回答された内容について質問した。

「まんまる」に、「ま」はいくつありますか

「まんまる」には「ま」が2つあります。

o1-previewにも聞いてみた。

o1-previewの思考の過程
英語+フランス語で「日本語の単語のサンプルの可能性を尽くす」という意味らしい

「まんまる」には「ま」が2つあります。
一文字ずつ分解すると:




このように、「ま」は1文字目と3文字目に現れています。

o1-miniにも聞いてみた。

o1-miniの思考の過程

「まんまる」には「ま」が 2つ含まれています。
具体的に分解すると:




このように、1文字目と3文字目に「ま」がそれぞれ現れています。
もし他にも質問があれば、ぜひ教えてください!

・o1-miniが、GPT-4oの回答に間違ったものがあることを指摘したが、「つばめ」は指摘していない
・「つ」と「づ」などを同一視している可能性がある

次の言葉でクロスワードパズルを作りたいと思います。交差させることができる組み合わせを10個あげてください

きつつき すすき かささぎ ふすま ささら つづみ すずむし はばたき こころ つばめ まんまる もも ささ ひひいろざる すいとう

きつつきすすき (「す」で交差)×
かささぎすすき (「さ」で交差)×
ふすまつづみ (「す」で交差)×
ささらすすき (「さ」で交差)×
つばめきつつき (「つ」で交差)
すずむしすすき (「す」で交差)
こころふすま (「こ」で交差)×
まんまるつばめ (「ま」で交差)×
ももまんまる (「も」で交差)×
ささかささぎ (「さ」で交差)

正答率は30%

o1-previewにも聞いてみた。

o1-previewの思考の過程

きつつきかささぎ (「き」で交差) × ← 「き」と「ぎ」は同じと認識した?
きつつきつづみ (「つ」で交差)
かささぎささら (「さ」で交差)
ふすままんまる (「ま」で交差)
つばめつづみ (「つ」で交差)
すずむしすいとう (「す」で交差)
はばたききつつき (「き」で交差)
ももまんまる (「も」で交差) × ← 原因不明
ささささら (「さ」で交差)
すすきすいとう (「す」で交差)

・正答率は80%(改善はされている。「き」と「ぎ」を同じと認識した? 正式版に期待)
(思考の過程の表現)
 ・「10の組み合わせを提供しても問題ありません。」←セキュリティチェック?
 ・「共通点を見つけるのが意外と難しくて」←本当にそう思ってる?
 ・「より面白い組み合わせを目指している」←「より面白い」って何?
 ・「もしかすると新たな組み合わせを見つけることで、提案の幅が広がるかもしれない」←予想、予測?

英単語ならGPT-4oは正しく処理できるかを確認しておいた。交差できる英単語を答えさせた。

AppleParallel (「P」で交差)
BananaMammal (「A」で交差)
SuccessSassafras (「S」で交差)
LetterButterfly (「T」で交差)
BalloonBubble (「B」で交差)
CoconutTurtle (「T」で交差)
MississippiSassafras (「S」で交差)
DinnerButterfly (「E」で交差)
TissueSuccess (「S」で交差)
CoconutTissue (「T」で交差)

正答率は100%

次は、拗音の扱い方を調べた。

日本語の単語で、拗音を含む単語を15個あげてください
それらの単語は、それぞれ何文字で構成されていますか

きゃく(客) – 3文字
しゃしん(写真) – 4文字
きゅうり(胡瓜) – 4文字
りゃく(略) – 3文字
じゅう(銃) – 3文字
ひょう(表) – 3文字
ぎゃく(逆) – 3文字
しゅみ(趣味) – 3文字
きょう(今日) – 3文字
りゅう(竜) – 3文字
しょどう(書道) – 4文字
びょういん(病院) – 5文字
じゃんけん – 5文字
じょうほう(情報) – 4文字
りゃくご(略語) – 4文字

正答率は100% 改善されたのか?

ChatGPT-4(レガシーモデル)にも聞いてみた。

それらの単語は、それぞれ何文字で構成されていますか

きゃく – 2文字  ×
しゃしん – 4文字
きゅうり – 4文字
りゃく – 2文字 ×
じゅう – 2文字 ×
ひょう – 2文字 ×
ぎゃく – 2文字 ×
しゅみ – 3文字
きょう – 3文字
りゅう – 3文字
しょどう – 4文字
びょういん – 5文字
じゃんけん – 5文字
じょうほう – 5文字
りゃくご – 4文字

正答率は約66%

ひらがなの扱いは改善されているが、まだ、信用しきれない。

(参考)
Claude 3.5 Sonnetでも試した。

きつつき × すすき (つ) ×
かささぎ × ささら (さ)
ふすま × すずむし (す)
つづみ × まんまる (ま) ×
はばたき × こころ (こ) ×
つばめ × もも (も) ×
ささ × すいとう (す) ×
ひひいろざる × こころ (ろ)
きつつき × つばめ (つ)
すすき × ささ (さ) ×

目次