1 / 10
🗣️ → 📊 → 🧠
会話の「くせ」から
性格を読み取れるか?

日本語の日常会話を数値化し、AIの「多数決」で性格を推定する研究

方法と結果のやさしい解説
福原玄・山下祐一・宗田卓史
2 / 10
方法
この研究がやりたいこと
💡 たとえ話
人の話し方には「くせ」があります。
たとえば、相手の話にすぐ「うんうん」と返す人、少し間を置いてから答える人、「えーと」が多い人…。
こうした「会話のくせ」を数値にして、その人の性格傾向と関係があるかを調べました。

🎯 研究の問い

日常会話の「間の取り方」「相槌の打ち方」「聞き返しの頻度」などから、性格の傾向を予測できるか?

🔬 なぜ重要?

将来的に、会話の特徴から発達特性(ASDなど)の早期スクリーニングに応用できる可能性があります。

📌 会話の「くせ」を数値化 → 性格との関連を統計的に検証する研究です
3 / 10
方法
研究の全体の流れ

大きく3つのステップで進めました。

flowchart LR A["🗣️ 日常会話
(120人分)"] -->|文字起こし済み| B["📐 会話のくせを数値化
(19指標)"] B --> C["🤖 4つのAIが
性格テストに回答
(120問)"] C --> D["📊 数値と性格の
関連を統計分析"] style A fill:#e8f4fd,stroke:#2166ac,color:#333 style B fill:#eafaf1,stroke:#27ae60,color:#333 style C fill:#fef5e7,stroke:#e67e22,color:#333 style D fill:#f5f0ff,stroke:#8e44ad,color:#333

Step 1: データ

国立国語研究所の日常会話コーパス(CEJC)から、自宅での少人数会話 120人分を使用

Step 2: 数値化

会話の「間」「フィラー」「相槌」「聞き返し」など19種類の指標を自動計測

Step 3: 性格推定

4つのAIが会話を読み、性格テスト(Big Five)に「本人として」回答

📌 会話 → 数値化 → AI採点 → 統計分析、の4段階パイプライン
4 / 10
方法
19の「会話のくせ」指標

会話から自動で測れる19の数値を、4つのカテゴリに分けました。

⏱️ テンポ・間(PG系: 8指標)

  • 発話率 — どれだけ話しているか
  • 沈黙の長さ(平均・中央値・長め)
  • 応答の遅れ(平均・中央値・長め)
  • 重なり率 — 同時に話す頻度
  • 沈黙のばらつき — 間の取り方の一貫性

💬 フィラー(FILL系: 2指標)

  • 「えーと」「あのー」の出現率
  • 100文字あたりのフィラー数

🔄 やりとりの型(IX系: 5指標)

  • 聞き返し率(「え?」「なに?」)
  • 質問後の聞き返し率
  • Yes/No応答率
  • 語彙のつながり
  • 話題の逸脱度

🎵 相槌・反応(RESP系: 3指標)

  • 「〜ね」の後の相槌率
  • 「〜ね」の後の反応の多様性
  • 「〜よ」の後の反応の多様性
📌 「何を話したか」ではなく「どう話したか」を測る指標です
5 / 10
方法
AIによる性格採点のしくみ
💡 たとえ話
4人の「読み手」(AI)が、ある人の会話を読んで「この人ならこう答えるだろう」と性格テスト120問に回答します。
4人の回答を平均して「多数決」にすることで、1人の偏りを減らします。
flowchart TD T["📝 会話テキスト
(1人分)"] --> AI1["🤖 Claude
Sonnet 4"] T --> AI2["🤖 Qwen3
235B"] T --> AI3["🤖 DeepSeek
V3"] T --> AI4["🤖 GPT-OSS
120B"] AI1 --> E["📊 4つの回答を
平均(アンサンブル)"] AI2 --> E AI3 --> E AI4 --> E E --> B5["🧠 Big Five
性格スコア"] style T fill:#fef5e7,stroke:#e67e22,color:#333 style E fill:#eafaf1,stroke:#27ae60,color:#333 style B5 fill:#f5f0ff,stroke:#8e44ad,color:#333
Big Five(ビッグファイブ)とは?
心理学で広く使われる性格の5つの軸です:
O(開放性)・C(誠実性)・E(外向性)・A(協調性)・N(神経症傾向)
📌 4つのAIの「多数決」で、1つのAIの偏りを打ち消す設計
6 / 10
方法
「本当に関係がある」と言えるか?

「会話のくせ」と「性格スコア」の関連が偶然ではないことを確かめるため、3つの検証を行いました。

🎯 Ridge回帰

19の指標から性格スコアを予測する数式を作ります。

たとえ
「応答が速い人ほど外向性が高い」のような関係式を見つける作業

🔀 置換検定

性格スコアをランダムにシャッフルして5,000回やり直し、「偶然でもこの精度が出るか?」を検証。

たとえ
名前と成績をバラバラに入れ替えても同じ結果が出るなら、それは偶然

🔄 ブートストラップ

データから繰り返しサンプルを取り直し(500回)、結果が安定しているかを確認。

たとえ
クラスの中から何度もランダムに選び直しても、同じ傾向が出るか確認
📌 「偶然ではない」「安定している」を3つの方法で多角的に検証
7 / 10
結果
結果①:「誠実性」が最も安定して予測できた

5つの性格軸のうち、C(誠実性:まじめさ・計画性)が、4つのAIのうち3つで統計的に有意でした。

AI教師 予測精度(r) 偶然の確率(p値) 判定
Claude Sonnet 4 0.434 0.0008 有意 ✓
Qwen3-235B 0.390 0.001 有意 ✓
GPT-OSS-120B 0.447 0.0008 有意 ✓
DeepSeek-V3 0.205 0.113 非有意
「有意」とは? — 偶然では起きにくい結果(p < 0.05)のこと。
p = 0.001 なら「1,000回に1回しか偶然では起きない」という意味です。
📌 4つのAI中3つで有意 → 「誠実性は会話のくせから読み取りやすい」
8 / 10
結果
結果②:AIの意見が揃う性格軸ほど予測しやすい

4つのAIが同じ人に対してどれだけ似た性格スコアをつけたか(一致度)を調べました。

C(誠実性)
0.70
← 最高
E(外向性)
0.64
N(神経症)
0.60
O(開放性)
0.56
A(協調性)
0.44
← 最低
読み方:バーが長いほど、4つのAIの「意見」が揃っています。
C(誠実性)はAI間で最も一致 → だから予測も安定。
A(協調性)はAIによって評価がバラバラ → 予測が不安定。
📌 AIの「採点のブレ」が小さい性格軸ほど、会話特徴からの予測も安定する
9 / 10
結果
結果③:どの「くせ」が誠実性と関係するか

ブートストラップ分析で、誠実性(C)の予測に安定して効いている指標を特定しました。

📈 誠実性が高い人の傾向

💬 フィラー(えーと)が多い
❓ 質問後に聞き返す
🗣️ 発話率が高い
🎵 「ね」の後に相槌を打つ

📉 誠実性が低い人の傾向

⏳ 応答が遅い
🔗 相手の言葉を繰り返す
⏸️ 沈黙が長い
解釈のポイント:
誠実性が高い人は「積極的に会話に参加し、確認を怠らない」傾向。
フィラーが多いのは「考えながら丁寧に話す」ことの表れと解釈できます。
※ これは相関であり、因果関係ではありません。
📌 「テンポよく応答し、確認を入れる」会話スタイルが誠実性と関連
10 / 10
まとめ
この研究でわかったこと

発見 1

会話の「くせ」19指標から、誠実性(C)は4つのAI中3つで有意に予測できた

🤝

発見 2

AIの「意見」が揃う性格軸ほど予測が安定。C(一致度0.70)が最高

🔍

発見 3

「応答の速さ」「フィラー」「聞き返し」が誠実性の主要な手がかり

🔬 この研究の新しさ
  • 「何を話したか」ではなく「どう話したか」に注目した初の体系的検証
  • 1つのAIに頼らず、4つのAIの多数決で偏りを減らした
  • 5,000回のシャッフルテストで「偶然ではない」ことを厳密に確認
⚠️ 限界と今後
  • サンプルは120人 — より大きなデータでの追試が必要
  • AIの採点は「仮想教師」であり、本人の自己評価との比較は今後の課題
  • 協調性(A)はAI間でブレが大きく、今後の改善が必要
キーでスライド移動