📝 こんな疑問を持っていませんか?
- 😕「官能評価」って言葉は聞いたことあるけど、結局なんのこと?
- 🤔「識別試験」「嗜好試験」…種類がありすぎて、どう使い分けるの?
- 💭人間の感覚なんて曖昧なのに、それで品質を測れるの?
✨ この記事の結論
官能評価とは「人間の五感を使って品質を測る方法」です。
評価の種類は大きく「識別試験」「嗜好試験」「分析型評価」の3つ。
目的に合わせて使い分けることで、機械では測れない「人が感じる品質」を数値化できます。
「このコーヒー、なんかいつもと味が違う気がする…」
「新しいシャンプー、香りがすごく良くなった!」
こんな「人間だからこそわかる感覚」ってありますよね。
実は、この「感覚」を科学的に測定する方法があるんです。それが「官能評価」。
食品メーカーが新商品を開発するとき、化粧品会社が使用感をテストするとき、自動車メーカーがシートの座り心地を評価するとき…すべて官能評価が使われています。QC検定でも頻出の重要テーマですし、品質管理に携わるなら知っておきたい知識です。
この記事では、官能評価の基本から、評価の種類・方法までを、初心者の方でも「なるほど!」とイメージできるように、コーヒーの味比べなど身近な例をたくさん使って解説していきますね。
目次
☕ 官能評価とは?|人間の「感覚」を科学する方法
まずは「官能評価ってそもそも何?」というところから、やさしく説明していきます。
🔬 機械で測れないものを「人間」が測る
品質を測る方法には、大きく分けて2つのアプローチがあります。
📊 機器分析(物理的測定)
温度計、重量計、色差計など
機械を使って数値化
例:「このスープは75℃です」
例:「この色はL*=65.2です」
👤 官能評価(感覚的測定)
人間の五感を使って評価
例:「このスープ、ちょうどいい温かさ」
例:「この色、食欲をそそる」
「温度が75℃」という数字は機械で測れます。でも、「ちょうどいい温かさかどうか」は人間にしかわからないですよね。
このように、「人間が感じる品質」を測定する方法が官能評価なんです。
💡 官能評価の定義
官能評価(かんのうひょうか)とは、人間の五感(視覚・聴覚・嗅覚・味覚・触覚)を測定器として使い、製品やサービスの品質特性を評価・測定する方法のこと。
🎯 なぜ官能評価が必要なの?
「機械で測れるなら、全部機械でいいじゃん」と思うかもしれません。でも、機械だけでは不十分な理由があるんです。
たとえば、こんなケースを想像してみてください。
🍜 ラーメン店の例
あるラーメン店が「スープの塩分濃度」を機械で測定したところ、
A店:1.2%、B店:1.2%で、まったく同じ数値でした。
でもお客さんに聞くと、「A店の方がしょっぱく感じる」という声が多数。
これは、他の成分(うま味・油分・温度など)との相互作用で、
人間が感じる「しょっぱさ」が変わるからなんです。
つまり、最終的に製品を使うのは「人間」なので、人間がどう感じるかを測ることが大切なんですね。機械の数値だけでは、本当の品質はわからないことがあるんです。
📚 関連記事
【QC検定】新QC七つ道具とは?|言語データを整理して問題解決に導く7つの手法
官能評価で得られたデータを整理するのに役立つ「新QC七つ道具」についても理解しておくと、分析の幅が広がりますよ。

🎨 官能評価の3つのタイプ|目的で使い分けよう
官能評価には、大きく分けて3つのタイプがあります。
「何を知りたいか」という目的によって、使う方法が変わるんですね。コーヒーの評価を例に、それぞれの違いを見ていきましょう。
①識別試験
Discrimination Test
「違いがわかる?」
2つ以上のサンプルに
差があるかどうかを判定
例:リニューアル前後で味が変わった?
②嗜好試験
Preference / Hedonic Test
「どっちが好き?」
消費者の好み・嗜好を
調査する
例:新商品と従来品、どちらが人気?
③分析型評価
Descriptive Analysis
「どんな特徴がある?」
製品の特性を詳しく
分析・記述する
例:酸味・苦味・香りを点数化
🎯 どのタイプを使うか?目的で選ぼう
「違いがあるか確認したい」
→ 識別試験
「お客さんの好みを知りたい」
→ 嗜好試験
「特徴を詳しく分析したい」
→ 分析型評価
それぞれのタイプについて、もう少し詳しく見ていきましょう。
① 識別試験(しきべつしけん)|「違いがわかる?」を確認
識別試験は、「2つのサンプルに違いがあるかどうか」を判定する方法です。
たとえば、こんなシーンで使われます。
- 原材料を変えたけど、味に影響がないか確認したい
- 製造工程を変更しても、品質が変わらないか検証したい
- 賞味期限を延ばしても、風味が劣化しないか調べたい
☕ コーヒーで例えると…
コーヒー豆の仕入れ先をA社からB社に変更することを検討中。
「B社の豆でも、今までと同じ味が出せるか?」を確認したい。
→ 識別試験で、お客さんが違いに気づくかをテスト!
識別試験の具体的な方法(2点比較法、3点比較法など)は、次のセクションで詳しく解説しますね。
② 嗜好試験(しこうしけん)|「どっちが好き?」を調査
嗜好試験は、消費者の「好き・嫌い」を調べる方法です。
「ヘドニックテスト(Hedonic Test)」とも呼ばれ、一般消費者をパネル(評価者)として実施することが多いのが特徴です。
☕ コーヒーで例えると…
新しいブレンドコーヒーを3種類開発した。
「どのブレンドがお客さんに一番人気か?」を知りたい。
→ 嗜好試験で、100人に飲み比べてもらって投票!
嗜好試験でよく使われるのが、「9段階ヘドニック尺度」です。
📊 9段階ヘドニック尺度の例
| 点数 | 評価 |
|---|---|
| 9 | 非常に好き(Like extremely) |
| 8 | かなり好き(Like very much) |
| 7 | やや好き(Like moderately) |
| 6 | 少し好き(Like slightly) |
| 5 | どちらでもない(Neither like nor dislike) |
| 4 | 少し嫌い(Dislike slightly) |
| 3 | やや嫌い(Dislike moderately) |
| 2 | かなり嫌い(Dislike very much) |
| 1 | 非常に嫌い(Dislike extremely) |
③ 分析型評価(ぶんせきがたひょうか)|「どんな特徴?」を数値化
分析型評価は、製品の特性を詳しく分析して記述する方法です。
「どんな味がするか」「どんな香りがするか」「どんな食感か」といった複数の特性を、訓練されたパネル(専門評価者)が点数化していきます。
☕ コーヒーで例えると…
新しいコーヒー豆の「風味プロファイル」を詳しく知りたい。
→ 分析型評価で、訓練されたパネルが各特性を評価!
酸味:7点、苦味:4点、コク:8点、フルーティー感:6点、
ナッツ感:3点、後味の持続:5点…といった形で数値化
分析型評価の結果は、レーダーチャート(スパイダーチャート)で可視化されることが多いです。「この製品は酸味が強くて、苦味は控えめで…」といった特徴が一目でわかるようになりますね。
📚 関連記事
【QC検定1級】データマイニング・テキストマイニング|品質管理におけるデータ活用
官能評価で得られた大量のデータを分析するには、データマイニングの知識が役立ちます。クラスタリングや分類などの手法を学んでおきましょう。

🔍 識別試験の方法|「違いがわかる」を科学的に検証
識別試験には、いくつかの定番の方法があります。
どれも「偶然で当たる確率」を考慮して、統計的に「本当に違いがわかっているのか」を判定できる仕組みになっています。それぞれの方法を見ていきましょう。
📌 2点比較法(一対比較法)
2つのサンプルを比較して、「違うかどうか」または「どちらが○○か」を判定する方法です。
「AとB、どっちが甘い?」
偶然の正解確率
1/2 = 50%
使いどころ
2製品の比較、優劣判定
📌 3点比較法(三点識別法/トライアングルテスト)
3つのサンプル(2つは同じ、1つは違う)から「違うもの」を選ぶ方法です。
「仲間はずれはどれ?」というクイズのようなイメージですね。
「仲間はずれはどれ?」→ 正解は右のB!
偶然の正解確率
1/3 ≒ 33%
使いどころ
微妙な違いの検出、原料変更の影響確認
偶然で当たる確率が約33%と低いため、「本当に違いがわかっている」ことを検証しやすいのがメリットです。食品業界でとてもよく使われる方法ですね。
📌 1対2点比較法(デュオ・トリオテスト)
基準となるサンプル(R)を提示し、2つのサンプルから「基準と同じもの」を選ぶ方法です。
「基準Rと同じものはどっち?」
偶然の正解確率
1/2 = 50%
使いどころ
標準品との一致確認、品質管理
「基準」を先に示すので、パネルが「何を基準に比較すればいいか」がわかりやすいのがメリット。品質管理の現場で、「標準品と同じ品質か?」を確認するときに便利です。
📋 識別試験の方法比較まとめ
| 方法 | サンプル数 | 偶然の確率 | 質問の形式 |
|---|---|---|---|
| 2点比較法 | 2 | 50% | どちらが○○か? |
| 3点比較法 | 3 | 33% | 違うものはどれ? |
| 1対2点比較法 | 3(基準+2) | 50% | 基準と同じはどれ? |
📚 関連記事
【QC検定】検定と推定の基礎|統計的仮説検定の考え方をわかりやすく解説
識別試験の結果を「統計的に有意かどうか」判定するには、検定の知識が必要です。仮説検定の基本を押さえておきましょう。

⚠️ 官能評価を成功させる4つのポイント
官能評価は「人間」が測定器になるため、ちょっとした工夫で結果の信頼性が大きく変わります。
評価を成功させるための重要なポイントを押さえておきましょう。
① パネル(評価者)の選定と訓練
「誰に評価してもらうか」はとても重要です。
🎓 分析型評価の場合
訓練されたパネルが必要。
「この酸味は3点くらい」という基準を揃えるため、事前のトレーニングを実施します。
👥 嗜好試験の場合
一般消費者で良い。
「実際に買う人がどう感じるか」を知りたいので、むしろ訓練していない人の方が適切です。
② バイアス(偏り)を防ぐ工夫
人間は無意識のうちに「先入観」や「順番の影響」を受けてしまいます。これを防ぐための工夫が大切です。
| バイアスの種類 | どんな影響? | 対策 |
|---|---|---|
| 順序効果 | 最初に試したものに影響される | 提示順序をランダム化 |
| 期待バイアス | ブランド名で評価が変わる | ブラインドテスト |
| 中心化傾向 | 極端な点数をつけない | アンカーサンプルで基準を示す |
| 後光効果 | 一つの良い点が全体評価に影響 | 評価項目を明確に分離 |
💡 ブラインドテストとは?
サンプルのブランド名や製品名を隠して評価してもらう方法。
「有名ブランドだから美味しいはず」という先入観を排除できます。
コーラの味比べで有名な「ペプシチャレンジ」もブラインドテストの一種ですね。
③ 環境条件の統一
評価を行う環境も結果に影響します。
- 照明:色の評価は照明によって見え方が変わる(自然光 vs 蛍光灯)
- 温度:食品は温度で味の感じ方が変わる
- 騒音:集中力に影響するので、静かな環境で
- におい:他のにおいがあると嗅覚評価に影響
④ 適切なサンプル数とパネル人数
統計的に意味のある結果を得るには、十分な人数が必要です。
📊 パネル人数の目安
識別試験
20〜40人
嗜好試験
50〜100人以上
分析型評価
8〜15人(訓練済み)
📚 関連記事
【QC検定1級】品質管理に携わる人の倫理|データ改ざん・偽装を防ぐ
官能評価でも、データの扱いには倫理観が必要です。都合の良い結果だけを採用するなど、データの恣意的な扱いは厳禁。品質管理の倫理についても学んでおきましょう。

📝 まとめ|官能評価で「人間の感覚」を科学しよう
最後に、この記事のポイントをまとめます。
✅ この記事のまとめ
1. 官能評価とは:人間の五感を使って品質を測定する方法。機械で測れない「人が感じる品質」を数値化できる。
2. 3つのタイプ:目的に応じて「識別試験」「嗜好試験」「分析型評価」を使い分ける。
3. 識別試験の方法:2点比較法、3点比較法(トライアングルテスト)、1対2点比較法などがある。
4. 成功のポイント:パネル選定、バイアス対策、環境統一、適切な人数確保が重要。
官能評価は、「人間が感じる品質」を科学的に測定するための強力な手法です。機械では測れない「美味しさ」「使い心地」「気持ちよさ」を数値化できるので、製品開発や品質管理には欠かせません。
QC検定でも出題される重要テーマですので、ぜひこの機会に基本をしっかり押さえておいてくださいね。
📚 次に読むべき記事
