やさしく解説 — 会話の「くせ」から性格を読み取れるか？

1 / 10

🗣️ → 📊 → 🧠

会話の「くせ」から
性格を読み取れるか？

日本語の日常会話を数値化し、AIの「多数決」で性格を推定する研究

方法と結果のやさしい解説
福原玄・山下祐一・宗田卓史

2 / 10

方法

この研究がやりたいこと

💡 たとえ話

人の話し方には「くせ」があります。
たとえば、相手の話にすぐ「うんうん」と返す人、少し間を置いてから答える人、「えーと」が多い人…。
こうした「会話のくせ」を数値にして、その人の性格傾向と関係があるかを調べました。

🎯 研究の問い

日常会話の「間の取り方」「相槌の打ち方」「聞き返しの頻度」などから、性格の傾向を予測できるか？

🔬 なぜ重要？

将来的に、会話の特徴から発達特性（ASDなど）の早期スクリーニングに応用できる可能性があります。

📌 会話の「くせ」を数値化 → 性格との関連を統計的に検証する研究です

3 / 10

方法

研究の全体の流れ

大きく3つのステップで進めました。

flowchart LR A["🗣️ 日常会話
（120人分）"] -->|文字起こし済み| B["📐 会話のくせを数値化
（19指標）"] B --> C["🤖 4つのAIが
性格テストに回答
（120問）"] C --> D["📊 数値と性格の
関連を統計分析"] style A fill:#e8f4fd,stroke:#2166ac,color:#333 style B fill:#eafaf1,stroke:#27ae60,color:#333 style C fill:#fef5e7,stroke:#e67e22,color:#333 style D fill:#f5f0ff,stroke:#8e44ad,color:#333

Step 1: データ

国立国語研究所の日常会話コーパス（CEJC）から、自宅での少人数会話 120人分を使用

Step 2: 数値化

会話の「間」「フィラー」「相槌」「聞き返し」など19種類の指標を自動計測

Step 3: 性格推定

4つのAIが会話を読み、性格テスト（Big Five）に「本人として」回答

📌 会話 → 数値化 → AI採点 → 統計分析、の4段階パイプライン

4 / 10

方法

19の「会話のくせ」指標

会話から自動で測れる19の数値を、4つのカテゴリに分けました。

⏱️ テンポ・間（PG系: 8指標）

発話率 — どれだけ話しているか
沈黙の長さ（平均・中央値・長め）
応答の遅れ（平均・中央値・長め）
重なり率 — 同時に話す頻度
沈黙のばらつき — 間の取り方の一貫性

💬 フィラー（FILL系: 2指標）

「えーと」「あのー」の出現率
100文字あたりのフィラー数

🔄 やりとりの型（IX系: 5指標）

聞き返し率（「え？」「なに？」）
質問後の聞き返し率
Yes/No応答率
語彙のつながり
話題の逸脱度

🎵 相槌・反応（RESP系: 3指標）

「〜ね」の後の相槌率
「〜ね」の後の反応の多様性
「〜よ」の後の反応の多様性

📌 「何を話したか」ではなく「どう話したか」を測る指標です

5 / 10

方法

AIによる性格採点のしくみ

💡 たとえ話

4人の「読み手」（AI）が、ある人の会話を読んで「この人ならこう答えるだろう」と性格テスト120問に回答します。
4人の回答を平均して「多数決」にすることで、1人の偏りを減らします。

flowchart TD T["📝 会話テキスト
（1人分）"] --> AI1["🤖 Claude
Sonnet 4"] T --> AI2["🤖 Qwen3
235B"] T --> AI3["🤖 DeepSeek
V3"] T --> AI4["🤖 GPT-OSS
120B"] AI1 --> E["📊 4つの回答を
平均（アンサンブル）"] AI2 --> E AI3 --> E AI4 --> E E --> B5["🧠 Big Five
性格スコア"] style T fill:#fef5e7,stroke:#e67e22,color:#333 style E fill:#eafaf1,stroke:#27ae60,color:#333 style B5 fill:#f5f0ff,stroke:#8e44ad,color:#333

Big Five（ビッグファイブ）とは？
心理学で広く使われる性格の5つの軸です：
O（開放性）・C（誠実性）・E（外向性）・A（協調性）・N（神経症傾向）

📌 4つのAIの「多数決」で、1つのAIの偏りを打ち消す設計

6 / 10

方法

「本当に関係がある」と言えるか？

「会話のくせ」と「性格スコア」の関連が偶然ではないことを確かめるため、3つの検証を行いました。

🎯 Ridge回帰

19の指標から性格スコアを予測する数式を作ります。

たとえ

「応答が速い人ほど外向性が高い」のような関係式を見つける作業

🔀 置換検定

性格スコアをランダムにシャッフルして5,000回やり直し、「偶然でもこの精度が出るか？」を検証。

たとえ

名前と成績をバラバラに入れ替えても同じ結果が出るなら、それは偶然

🔄 ブートストラップ

データから繰り返しサンプルを取り直し（500回）、結果が安定しているかを確認。

たとえ

クラスの中から何度もランダムに選び直しても、同じ傾向が出るか確認

📌 「偶然ではない」「安定している」を3つの方法で多角的に検証

7 / 10

結果

結果①：「誠実性」が最も安定して予測できた

5つの性格軸のうち、C（誠実性：まじめさ・計画性）が、4つのAIのうち3つで統計的に有意でした。

AI教師	予測精度（r）	偶然の確率（p値）	判定
Claude Sonnet 4	0.434	0.0008	有意 ✓
Qwen3-235B	0.390	0.001	有意 ✓
GPT-OSS-120B	0.447	0.0008	有意 ✓
DeepSeek-V3	0.205	0.113	非有意

「有意」とは？ — 偶然では起きにくい結果（p < 0.05）のこと。
p = 0.001 なら「1,000回に1回しか偶然では起きない」という意味です。

📌 4つのAI中3つで有意 → 「誠実性は会話のくせから読み取りやすい」

8 / 10

結果

結果②：AIの意見が揃う性格軸ほど予測しやすい

4つのAIが同じ人に対してどれだけ似た性格スコアをつけたか（一致度）を調べました。

C（誠実性）

0.70

← 最高

E（外向性）

0.64

N（神経症）

0.60

O（開放性）

0.56

A（協調性）

0.44

← 最低

読み方：バーが長いほど、4つのAIの「意見」が揃っています。
C（誠実性）はAI間で最も一致 → だから予測も安定。
A（協調性）はAIによって評価がバラバラ → 予測が不安定。

📌 AIの「採点のブレ」が小さい性格軸ほど、会話特徴からの予測も安定する

9 / 10

結果

結果③：どの「くせ」が誠実性と関係するか

ブートストラップ分析で、誠実性（C）の予測に安定して効いている指標を特定しました。

📈 誠実性が高い人の傾向

💬 フィラー（えーと）が多い	↑
❓ 質問後に聞き返す	↑
🗣️ 発話率が高い	↑
🎵 「ね」の後に相槌を打つ	↑

📉 誠実性が低い人の傾向

⏳ 応答が遅い	↓
🔗 相手の言葉を繰り返す	↓
⏸️ 沈黙が長い	↓

解釈のポイント：
誠実性が高い人は「積極的に会話に参加し、確認を怠らない」傾向。
フィラーが多いのは「考えながら丁寧に話す」ことの表れと解釈できます。
※ これは相関であり、因果関係ではありません。

📌 「テンポよく応答し、確認を入れる」会話スタイルが誠実性と関連

10 / 10

まとめ

この研究でわかったこと

✅

発見 1

会話の「くせ」19指標から、誠実性（C）は4つのAI中3つで有意に予測できた

🤝

発見 2

AIの「意見」が揃う性格軸ほど予測が安定。C（一致度0.70）が最高

🔍

発見 3

「応答の速さ」「フィラー」「聞き返し」が誠実性の主要な手がかり

🔬 この研究の新しさ

「何を話したか」ではなく「どう話したか」に注目した初の体系的検証
1つのAIに頼らず、4つのAIの多数決で偏りを減らした
5,000回のシャッフルテストで「偶然ではない」ことを厳密に確認

⚠️ 限界と今後

サンプルは120人 — より大きなデータでの追試が必要
AIの採点は「仮想教師」であり、本人の自己評価との比較は今後の課題
協調性（A）はAI間でブレが大きく、今後の改善が必要