みすず書房

測ることの悩み(1)

測ることの悩み(1)

カツ丼を妄想する

随分と前のことになるが、NHKに「妄想ニホン料理」という番組があった(1)。海外の料理人が、日本の料理(「かっぱ巻き」など)を簡単なヒント(「河童の名を冠した細巻き寿司」「キュウリを使用」「海苔で巻く」)だけを手がかりに再現するという番組で「あれ、なんで終わっちゃったんだろうねぇ」「やっぱりロケ費用が嵩んだんじゃないの」などと今でも家族で懐かしむことがある名番組であった。

さすがに10年以上前のことなので詳細は思い出せないのだが(2)、各国の料理人が作る「がんもどき」(「雁に似せた料理名」「弁当に入れると悲劇的結末を迎える練り物」)や「親子丼」(「食材が親子」「出来上がりは日本語で言うと“トロトロ”」)は、それぞれ工夫を凝らした、実に美味しそうなものであったことはよく覚えている。しかしどれだけ美味しそうであっても、それらは時に微妙に、時に大胆に本来のがんもどきや親子丼とは違っていて、市場に食材の買い出しに出かけるところからして「なんで? なんでそれ買っちゃう?」とか「なるほど、そう来たか!」と毎週の放送にワクワクしどおしであった。そもそも「勝負の前のゲン担ぎに食べる」「ご飯の上に何かのった料理」「刑事が容疑者の心を開くために出す」などというヒントからカツ丼を再現しろというのが土台無理な話なわけで(3)、そこら辺の無茶振りスタイルも含めてそのまま、NHKさんにはぜひ復活をご検討いただきたい。単発のスペシャル版でもよいです。

例によって心理学とはおよそ関係なさそうな話題から始まったのであるが、もちろんそれは、連載にかこつけてNHKに要望を伝えたいからだけではなく、きちんと心理学研究との関連もあるからである。概念の定義という心理学研究の方法論的大問題に、妄想ニホン料理と同じ構造を見て取ることができるのだ。順を追って説明してみたい。

「嘘」を概念的に定義する

心理学の研究では、そこで用いる概念を定義することがとても大事になることは、この連載でも繰り返し述べてきたところである。ところで、ここまであまり強調してこなかったことだが、定義にもいくつか種類がある。心理学で主に問題となるのは「概念的定義」と「操作的定義」である。

まず概念的定義である。シンプルに言ってしまえば概念的定義とは、研究対象である語や概念の、辞書に載っているような意味ということになる。もちろん日常言語における語の意味と、心理学研究における概念的定義とは、必ずしも同じものではない。「嘘」という概念を例に考えてみよう。試しにMacに入っていた辞書アプリ(スーパー大辞林)で「嘘」を調べてみたところ、下の説明が出てきた。

うそ【噓】
① 事実を曲げてこしらえたこと。本当でないこと。偽り。「―をつく」
② 誤り。間違い。「―字」
③ 望ましくないこと。すべきでないこと。「ここであきらめるのは―だ」〔相手の言葉に驚いた時などに,「うそ!」「うっそー」などと「本当?」の意で感動詞的にも用いる〕

心理学で「嘘」の研究というと①を指し、特に「嘘をつく」という人間の行動を対象とすることがほとんどである。つまり日常言語において「嘘」という語には少なくとも三つ意味があるところ、心理学研究ではそのうちの一つについてしか「嘘」という語で言及することはない。もちろん②や③の意味で用いることが全くないわけではないだろうが、混乱を避けるために、異なる語を当てるのが普通である(4)

それでは嘘をつくこと、つまり「事実をまげて、本当でないことを言うこと」とは、どういう意味だろうか。もう少し丁寧にみると「事実をまげて」という但し書きがついていることに気がつく。意図せずに本当でないことを言ってしまうことは、誰にでもある。それまで「嘘」と言われてしまった暁には、テストで自信満々に誤答を記入した受験生たちがことごとく嘘つきになってしまうから、この但し書きが必要であることは分かる。

それでは「事実をまげる」とはどのような意味だろうか。残念ながら辞書アプリに「事実をまげる」と入れても「何も見つかりませんでした」というつれない回答が返ってくるだけであった。埒が明かないので、心理学者が「嘘」を概念的に定義している文献を探してみることにしよう。ちょうど良いことに日本心理学会の機関誌『心理学ワールド』で「うそ・ウソ・嘘」という特集号が組まれたことがあった(5)。その冒頭の論文から引用させていただこう(6)

…欺瞞とは他者を意図的に誤った方向に導くことであり,嘘とは欺瞞のサブタイプで,間違っていることが分かっている情報を言って他者をだますこと…(村井, 2015)

「間違っていることが分かっている情報を言って他者をだますこと」。心理学の専門家集団の公式出版物に載っている定義でもあることだし、ひとまずはこれを、心理学研究における「嘘」の概念的定義としてよいだろう。

「嘘」を操作的に定義する

比較的すんなりと定まった概念的定義に対して、「嘘」の操作的定義はやや厄介である。ここで操作的定義とは「実験参加者が何をしたら、(先に概念的に定義された)嘘をついたと判断するのか」といった意味である(7)。例えば「人は部屋が暗いと嘘をつきやすくなる」という仮説を検証することを考えてみよう。実験室を暗くした条件(実験条件)と、明るくした条件(統制条件)を設け、前者で統計的に有意に多くの嘘が生じるか検証するというのが標準的なやり方で、ここまでは前回、前々回の連載で紹介したとおりである。

そこまで考えたところで、けっこうな難問に気づく。実験室にやってきた参加者にどうやって嘘をついてもらえばよいだろうか。彼女らに「はい、何でも良いから嘘をついて下さい」と指示しても始まらない。参加者は嘘をつこうと頑張ってくれるかもしれないが、そもそも「嘘」の概念的定義には「だまそうとする」という限定が入っている。頼まれてつく嘘を「嘘」と呼んで良いのか、やや疑問が残る。何より参加者ごとに嘘の内容が異なることで、どこからが嘘でどこからが嘘でないのかの判断が困難になってしまう。「実は結婚当初から、朝食に夫が用意してくれる納豆が嫌で嫌でたまらなかったんです。彼にとっては大好物なのですが。もう10年にもなるんですけど、我ながらよく我慢していると思います。というのはもちろん、嘘ですよ。(ニッコリ)」と言われたとして、それが概念的に定義した「嘘」に該当するのかいちいち判断するのは困難だし、手間もかかる。

サイコロと嘘

実験参加者がなるべく同じ形で嘘をつくような場面(実験パラダイム)を作れると、研究上とても助かる。このニーズに応えて色々と提案されてきた方法の一つに「カップの中のサイコロ」というものがある。参加者に底に穴を開けた紙コップを渡し、ひっくり返した紙コップの中でサイコロを転がしてもらう。出目を穴から覗いて答えてもらうのである。このとき出目×100円の報酬を出すことにしておこう。出目を見ることができるのは参加者だけだから、嘘をつこうと思えば容易につける。しかも出目が大きいほど報酬額が大きいのだから、嘘をつく動機もある。

それだと嘘はついてもらえるけれど、嘘をついたかどうかわからないじゃないか。そう思われた読者がいらっしゃると、筆者の狙い通りである。たしかに一人ひとりの参加者の回答が嘘であったのか知ることはできない。しかし、大勢の参加者を集めて実験するなら話が変わってくる。サイコロに偏りがなくて、全ての参加者が正直に答えたのならば、1から6のそれぞれの目を答えた人の割合がだいたい同じになるはずだからだ。

もちろん完全に均等に1/6ずつになるはずはなく、ある程度の偏りは生じる。問題はそれが、偶然ではあり得ないほど、大きな目に偏っていたと言えるのか、というところにある。幸いなことに偏りの程度をp(8)として計算することが可能である。それゆえ、例えばp値が5%より小さかったら(つまり偶然だけでは100回に5回未満しか生じないような偏りだったら)参加者の嘘によって偏りが生じたと判断することに決めてしまうことができる。言い換えると「カップの中のサイコロ」実験では、参加者たちの回答が大きな出目に統計的に有意に偏っていることをもって、「実験参加者たちの嘘」と操作的に定義するということになる(9)

操作的定義は合っているか

心理学で用いる概念について、概念的定義を定める作業は、もともと私たちが抱いている語や概念の意味を明確にしようとするものであった。研究対象が明確に定まっていなければ何を研究しているのか分からなくなってしまうから、これは当然、必要なステップである。それに対して操作的定義を定めることは、そのようにして定めた概念的定義に合うように実験場面などを設計するものである。こちらは具体的に研究を進め、理論や仮説についての判断の根拠を集めるうえで必要な手順ということになる。同じ「定義」といっても、研究者が行っていることはけっこう違うことが分かる。そこから次の疑問が生じる。研究者が設計した操作的定義は、きちんと概念的定義と合致しているのだろうか、という疑問である。少し整理してみよう。


「嘘」の概念的定義:間違っていることが分かっている情報を言って他者をだますこと
「嘘」の操作的定義(10):参加者全体の報告を見ると、報告が大きな出目に統計的に有意に偏っている(有意水準は5%とする)。
 

なかなか良い操作的定義のように思えるが、完璧ではない。例えばサイコロの目が本当にたまたま大きな目に偏って出てしまっていた場合や、たまたま見間違いが頻発した場合にも、この操作的定義の下では「嘘があった」と判定される。サイコロがとても小さく、参加者が老眼の持ち主ばかりだったら、そういうこともあるかもしれない。「間違っていることが分かっている情報を言」ったわけではないから嘘ではないのに、嘘と判定してしまうわけで、つまり操作的定義と概念的定義がずれている。こうしたずれを偶然による誤差(random error)と呼んだりする。

また別の形で両者がずれることもあるだろう。サイコロが歪んでいて、5や6が出やすくなっていたらどうだろうか。全ての参加者が正確かつ正直に回答したとしても、やはり「嘘があった」という判定が出る。こうしたずれ方は(ずれ方に決まった方向性があるという意味で)系統的な誤差(systematic error)と呼ばれる(11)

とは言え「カップの中のサイコロ」実験における「嘘」の操作的定義は、おおむね概念的定義をなぞっているように思われる。もしも誤差を防ぐ手立てが十分に整っていて、それでもなお回答が偏っていたとなれば、ほとんどの人は「そりゃあ、回答者が嘘をついたのだろう(間違っていることが分かっている情報を言って他者をだまそうとしたのだろう)」と納得するだろう。こうした時に心理学では、この操作的定義は妥当(valid)である、などと言う。

カツ丼を操作的に定義する

ここまで読まれた方には、心理学研究における概念の操作的定義が、どこか妄想ニホン料理に似ていることに気づいていただけたのではないだろうか。ヒントに合うように料理の再現を試みること(妄想ニホン料理)と、概念的定義に合うように操作的定義を工夫すること(心理学実験)は、「お題」(ヒント/概念的定義)を手持ちの素材と技術で表現しようとするところに、同じ構造がある。心理学研究は料理に似ているのだ。

もっとも、両者には大きな違いがある。バラエティ番組である「妄想ニホン料理」では、受けを狙ってわざと参考にならないヒントを示していた。カツ丼の概念的定義が、本当のカツ丼のそれとしては不適切であったということだ。本気で日本料理を再現するなら必要不可欠な情報――材料、味付け、加工方法など――の多くを欠いた概念的定義をわざと示し、その穴を各国の料理人に埋めてもらう。そのことによって各国の料理人の創意工夫を引き出し、国ごとの食文化の違いをあぶり出し、料理というものの奥深さをもあらわにする。本物と再現をずらすことにこそ番組の狙いがあった。これは“本物”と“再現”をなるべく一致させることが望ましい心理学実験とは大きく異なる。

ここから分かることは、妄想ニホン料理での“ヒント”にあたる“概念的定義”にも、その良し悪しがあるということだ。先ほど「嘘」の操作的定義が、その概念的定義に合っているかという問題があることを述べた。しかし、いくら操作的定義が概念的定義に合っていたからといって、それだけでは、もともと研究したいと思っていた対象(概念)を上手に料理できた保証にはならないのである。それは、料理人たちが作り上げた「妄想ニホン料理」たちが、いくら示されたヒントに合致していたからといって、それだけでは本当のカツ丼やがんもどきやかっぱ巻きとは呼べないのと同じである。まずは概念的定義が“妥当”なものでなければならない。

こと心理学研究においては、概念的定義の妥当性は、大きな問題とされないことが多い。本稿で採用した「嘘」の心理学的な概念的定義(「間違っていることが分かっている情報を言って他者をだますこと」)について、全く見当違いという人は多くないだろう。普段から慣れ親しんだ概念(お題)を扱うことが多く、頓珍漢な概念的定義をしてしまう危険性が低いという意味において、心理学研究は、親に作ってもらった料理を独り立ちして初めて再現する場面のほうが似ているかもしれない。その上、大学や大学院などでの経験を通じて“料理”の修行も積んでいるとなれば、いくらかの試行錯誤はあるかもしれないが、思い出にある“本物”のカツ丼とそれなりに合致した、妥当な「操作的カツ丼」を作れる公算は小さくない。

もちろん、これが常にうまくいくとは限らない。その代表例が概念を輸入する場面である。料理の例で言えば、トウモロコシのない地域・時代に転生して、どうしてもトルティーヤを食べたくなって「穀物を粉にして捏ねてのばして堅く焼いたもの。味は塩っぱい系で」と注文したら煎餅が出てきた、みたいな話である。料理人側の知識体系にない情報を含む概念を伝えるのは、一筋縄ではいかない。同じように、たとえば self esteem という概念を「自尊心」と訳しただけで、両者が同じものを指していると無邪気に信じてしまうことには危うさがある。この問題もいずれ扱いたいところだが、紙幅もあるので、今回は少し違う話をして次回へのつなぎとしたい。ある概念についての「程度問題」を扱うときの難しさ、という話である。

メロンパンの出来栄えを評価する

ここまでの話は「嘘」や「カツ丼」についてイチかゼロかの二値判断をするための定義の話だった。「妄想ニホン料理」のテーマがカツ丼だったら、出来上がった料理はカツ丼であるか(イチ)カツ丼でないか(ゼロ)のいずれかであって「今回の料理は、どちらかと言えばカツ丼でしたね」といったものではない。「カップの中のサイコロ」実験についても、参加者の回答が大きな出目に偏っていたら嘘はあった(イチ)ことになるし、そうでなければ嘘はなかった(ゼロ)と判断される。そのための操作的定義であって、「今回は、やや嘘がありましたね」「どちらかと言えば嘘がありましたね。65点かな」などという判断を助けるものではない(12)

とは言え現実には程度問題を評価したいときもある。番組を盛り上げる装置として、スタジオの出演者たちが「今回の料理のカツ丼再現度」を得点化するイベントを設けることは十分に考えられる。あるファンの方がネット上に残してくれた記録によれば、フランスの人間国宝級パン職人が焼き上げた“パン・ドゥ・ムロン”(メロンパン)は、見た目からして本物のマスクメロンを彷彿とさせる見事な造形で、もはや「新しいメロンパン」と呼びたくなるような出来栄えであったという(13)。写真を見ると、確かにこれこそがメロンパンであり、日本のメロンパンのどこがメロンなのかという(多くの人が公言を避けてきた)疑問が思わず口をついて出そうになる(14)

この“パン・ドゥ・ムロン”と日本のメロンパン、さらにはもう一人の妄想料理人であったトルコのシェフが焼き上げた“メロンパン”、どれがもっとも「メロンパン」としてより相応しいか、順位をつけたい気にもなってくる。ところが困ったことにメロンパンの回に提示されたヒント(概念的定義)は「メロンパンとはメロンのパンという意味だがメロン(果物)は使わない」「上から触った時と下から触った時で触感が違う」「食べた時、口の中に生地がくっつくことがある」というものであった。三つの“操作的メロンパン”は全てこの概念的メロンパンに合致しているため、そこに優劣をつけることはできない。つまり「メロンパン度」を評価したいと考えるのであれば、概念的定義を考え直す必要が出てくるのだ。

「嘘」の程度を評価する

同じように「今回はかなり嘘がありましたね」「今回は、それほど嘘がなかったですね」という判断をしたいとなると操作的定義に手を加える必要があり、そして、これもまた概念的定義の掘り下げが要求されることになる。

例えば出目の回答が「4」より「5」、「5」より「6」に偏っているときに「より大きな嘘をついた」と判断することにして、それを得点化することができるかもしれない。回答を600回集めたとして、「4」、「5」、「6」の回答が(期待値である)100回よりも多かった回数を重み付けして足し合わせたらどうだろう。「4」なら1、「5」なら2、「6」なら3を、期待よりも多く報告されていた回数にかけ合わせて、合計する。

 嘘度の操作的定義A
  「4」:105回 → 5×1=5
  「5」:110回 → 10×2=20
  「6」:108回 → 8×3=24
  合計(嘘度得点):49点

といった塩梅である。悪くなさそうだが、なぜ「5」のときは2を、「6」のときは3を掛けるのか、確たる根拠は特にない。それならばと違う値を使うと、結果も違うものになる。

 嘘度の操作的定義B
  「4」:105回 → 5×1=5
  「5」:110回 → 10×1.1=11
  「6」:108回 → 8×1.2=9.6
  合計(嘘度得点):25.6点

2つの操作的定義を比べると「5」と「6」の出目が「嘘度得点」に与える影響が逆転している。最初の定義Aだと「6」に8回偏ることは、「5」に10回偏ることよりも「嘘度」としては大きいと判断されていたが(24 vs. 20)、二つ目の定義Bでは逆になっている(11 vs. 9.6)からである。どちらがより妥当な操作的定義なのか決めようとすると、ここで「嘘度」の概念的定義がかかわってくる。

仮に「嘘の大きさとは即ち嘘によって得る利益の大きさである」と概念的に定義するのならば、操作的定義Aのほうが妥当そうである。出目を「5」と偽ることで、「4」と偽ったときよりも100円多く利益を得られ、「6」と偽ることでは200円多くの利益を得られる(出目×100円が報酬だったことを思い出そう)。操作的定義Aで計算される嘘度の差は、「5」と「4」の差が1、「6」と「4」の差が2となっていて、不当に得る利益の差と対応している。

他方、「嘘の大きさは、それを発する人の心の葛藤の大きさによって決まる」と概念的に定義するのであれば、操作的定義Bのほうが妥当だという人も出てくるかもしれない。葛藤がもっとも大きいのは「嘘をつく」という最初のハードルを超えるところにあって、それさえ超えてしまえば嘘の内容による差など微々たるものだ、という意見である。操作的定義では「4」「5」「6」による嘘度の違いは小さく、この意見に対応しているように思える。

さらに加えて、読者の方々の中に上記2つのいずれにも納得できないという方もいらっしゃるだろう。問題なのは、それらの概念的定義と、対応する操作的定義のどれが「嘘度」の定義として適切なのか、客観的・科学的な正解を得ることが、ほとんど無理という点にある。

何が妥当な概念的定義であるかは、最終的には個々人の価値観や、何のために「嘘度」を決めようとしているのかといった実用的な問題となるだろう(15)。心にかんする概念について、その「程度問題」を概念的に定義すること、そしてその大きさを測定する妥当な操作的定義を考えることが、意外な難問であること、そこには価値(value)の問題が入りがちであることが分かる。

「心の違い」を測定する

こうした「程度問題」を決めることを「測定」(measure)と呼ぶ。心理学研究の中で、歴史的に測定が大きな問題として扱われてきたのは、個人差を扱う分野である。具体的には知能研究やパーソナリティ(性格)研究がこれに当たる。そこでは個々の人々の“心”のありようを、例えば“知能”といった物差し(measure)を使って測ろうとする。そして、「そもそも知能とは何なのか」(知能の概念的定義)、「知能をどう測定するのか」(知能の操作的定義)、そして両者の間にはどのようなズレ(偶然誤差、系統誤差、妥当性)が、どれくらい生じる恐れがあるのかといった問題が活発に議論されてきた。

議論が活発に進みすぎた結果として「知能とは、知能検査が測定したものである」という、操作的定義がすなわち概念的定義であるといった逆転した主張が声高に唱えられることすらある(16)。料理に例えれば「この土地の葡萄を使ってこの手順で作ったものだけがシャンパンであり、それ以外の発泡ワインはシャンパンではない」といった状況だろうか。他方で、概念的定義を明確にしないまま無分別に大量の操作的定義(さまざまな心理尺度)が提案されているとの批判もある(17)。何にでも「生」をつけたがる最近の風潮(「生チョコ」「生キャラメル」「生食パン」「生どら焼き」)は、これに少し近いかもしれない。

こうした個人差研究の心理学は、ここまで扱ってきた実験による心理学研究とは、少し異なったアプローチをとる(18)。次回はその現場でどのようなことが行われているのかを紹介してみたい。

  1. 「妄想ニホン料理」放送は2013年から2015年。今回調べるまで、番組終了から10年も経っているとは思っていませんでした。いつか再開して欲しい。 https://www2.nhk.or.jp/archives/movies/?id=D0009050701_00000
  2. GPT-5のDeep Researchにかなりお世話になりました。
  3. スポニチ・アネックス, 2013年11月8日 15:08の記事より。 https://www.sponichi.co.jp/entertainment/news/2013/11/08/articles/K20131108006972050.html
  4. 同じ語で異なる概念を指してしまう混乱が皆無なわけではない。ジングルの誤り(jingle fallacy)と呼ばれる。
  5. 『心理学ワールド』は下記URLから無料で読むことができる。 https://psych.or.jp/publication/world/
  6. 村井潤一郎. (2015). 社会心理学における嘘研究 ─現状と展望,嘘に対する雑感. 心理学ワールド, 71, 5–8. https://psych.or.jp/wp-content/uploads/2017/10/71-5-8.pdf
    村井は嘘の定義を述べるに当たって Levine (2014)を引用している。
    Levine, T. R. (2014). Truth-Default Theory (TDT): A theory of human deception and deception detection. Journal of Language and Social Psychology, 33(4), 378–392. https://doi.org/10.1177/0261927x14535916
  7. 概念的定義とは何か、操作的定義とは何かという問いは真剣に論じるに値する問題だが、「心理学の現在地を探る」という本連載の趣旨に鑑み、現代の心理学者がおおよそ考えている概念的定義、操作的定義について、ここでは話をすることにする。
  8. 連載第4回参照。
  9. 無線で出目をスマホなどにおくるハイテク・サイコロを使うという力技の手法もあり、実際にそれを用いた心理学実験も行われている。
    Oda, R., Kato, M., & Hiraishi, K. (2018). Effects of observed counterfactual on prosocial lying: A preliminary report. Letters on Evolutionary Behavioral Science, 9(2), 5–8. https://doi.org/10.5178/lebs.2018.66
  10. あくまでこの実験における操作的定義である。
  11. 勘の良い方は、ここで出てきた偶然誤差や系統誤差というものが、前回、前々回で紹介した撹乱要因によって生じる「生姜焼きの味の違い」に相当することに気づかれたことだろう。
  12. 検定の結果が有意でないときに帰無仮説を積極的に採用する(「嘘はなかった」と判断する)か、判断を保留する(「嘘があったとは言えないが、嘘はなかったとも言えない」と保留する)のかは、実は難しい問題である。教科書的には保留が望ましい態度とされることが多いが、公刊されている論文では帰無仮説を積極的に採用していることが少なくない。それが必ずしも間違いとは言い難いこともある。
  13. 見たはずなのに覚えていない自分の記憶力が恨めしい。
  14. 翔白坂. (2014, February 2). NHK「妄想ニホン料理」でメロンパンを知らない人間国宝パン職人が作ったメロンパンがすごかった. SHO SHIRASAKA. https://shirasaka.tv/7086
  15. 出目一つについて100円が加算されることをもって、400円、500円、600円それぞれの価値を表す効用関数を用いて重み付けをすることは考えられる。しかし「嘘の大きさは、それによって得られる効用の大きさに比例する」というのもまた、一つの立場に過ぎない。
  16. 知能研究の入門として繁桝 (2025)をあげる。
    繁桝算男. (2025). 知能とは何だろうか:5つの視点から考える. 新曜社. https://www.shin-yo-sha.co.jp/book/b666928.html
  17. 誰もが「自分だけの心理尺度」を使いたがるという意味で「心理尺度の歯ブラシ問題」と呼ばれる。
    Elson, M., Hussey, I., Alsalti, T., & Arslan, R. C. (2023). Psychological measures aren’t toothbrushes. Communications Psychology, 1(1), 1–4. https://doi.org/10.1038/s44271-023-00026-9
  18. Cronbach, L. J. (1957). The two disciplines of scientific psychology. The American Psychologist, 12(11), 671–684. https://doi.org/10.1037/h0043943