データサイエンティスト検定

DS検定の数学問題を攻略|線形代数・微積分・集合論の必須知識まとめ

😣 こんな不安、ありませんか?
  • 「DS検定の出題範囲を見たら"線形代数"って書いてあって固まった」
  • 「微分・積分って高校で赤点だったんだけど…」
  • 「集合論?ベン図? 聞いたことはあるけど、ちゃんと理解できていない」
  • 「数学が苦手な自分には、DS検定は無理なのでは?」
✅ この記事でわかること
  • DS検定で「実際に問われる数学のレベル」が具体的にわかる
  • 線形代数(ベクトル・行列)の意味と基本演算を図解で理解できる
  • 微分・積分の「本質」を、日常の例えで直感的に掴める
  • 集合論(和集合・積集合・補集合)をベン図でスッキリ整理できる
  • 「ここだけ押さえればOK」な最低限の知識範囲が明確になる

安心してください。DS検定の数学は、大学の数学科レベルではありません。

DS検定の数学対策に関する解説記事(GRI)によると、「純粋な数学の問題は、基本的に高校数学ⅡB〜ⅢCレベルがほとんど」とのこと。つまり、大学受験レベルの難問が出るわけではなく、「用語の意味」「基本的な計算」「概念の理解」が問われるのです。

実際に公式スキルチェックリスト(ver4.00・PDF)を見ても、★1(見習いレベル)の数学は「ベクトルの内積が計算できる」「微分の意味を説明できる」「ベン図で集合演算を説明できる」といった、基礎の基礎が中心です。

💡 この記事のスタンス
数学の教科書を1冊まるごと解説するのではなく、「DS検定で実際に問われる範囲だけ」を厳選して、図解でわかりやすくまとめます。数学が苦手な方でも「これならわかる!」と思えるレベルまで噛み砕いて説明しますので、最後まで読んでみてください。
📘 前提知識
DS検定(データサイエンティスト検定)とは?試験概要・合格率・3領域を徹底解説 →

DS検定の全体像をまだ把握していない方は、先にこちらの記事をお読みください。

まずは全体像|DS検定の数学は「3つの山」を登るだけ

DS検定のデータサイエンス力で問われる数学は、大きく3つの分野に分かれます。ここをまず頭に入れておくと、「自分がどの山を登っているのか」が迷子にならずに済みます。

🧭
山① 線形代数
・ベクトルとは?
・ベクトルの内積
・行列とは?
・行列の演算
・逆行列・行列式
📈
山② 微分・積分
・微分の意味(傾き)
・基本的な微分の計算
・偏微分の考え方
・積分の意味(面積)
・微分と機械学習の関係
山③ 集合論
・集合の基本概念
・和集合・積集合
・差集合・補集合
・対称差集合
・論理演算との対応
⚠️ 重要な前提
DS検定は選択式(マークシート形式)です。記述式で数式を書かされることはありません。つまり「自分で計算を一からやる」のではなく、「選択肢の中から正しいものを選べればOK」です。この事実だけで、ハードルがかなり下がるはずです。

では、1つずつ登っていきましょう。まずは「線形代数」から。

山①:線形代数|ベクトルと行列の基礎

「線形代数」と聞くと、大学の難しい講義を想像するかもしれません。でも、DS検定で問われるのはその入口の入口。「ベクトルと行列の基本がわかるか?」というレベルです。

ベクトルとは?——「方向と大きさ」を持つ矢印

ベクトルとは、「方向」と「大きさ」の両方の情報を持つ量のことです。

カーナビの案内に例えるとわかりやすいです。「500メートル進む」だけでは目的地に着けませんよね。「北に向かって500メートル進む」——この「北に向かって(方向)」+「500メートル(大きさ)」がセットで1つの情報になっている。これがベクトルです。

📐 ベクトルの表記
2次元のベクトルは、数字の組で表します。

a⃗ = (3, 4)

これは「右に3、上に4進む矢印」を意味します。データサイエンスでは、データの特徴を数値の組として表現するためにベクトルが使われます。たとえば、ある人の「身長」と「体重」のデータは (170, 65) というベクトルで表現できます。

ベクトルの基本演算|足し算・引き算・スカラー倍

ベクトルの計算は、成分ごとに計算するだけ。シンプルです。

演算 ルール 具体例
足し算 同じ位置どうしを足す (1, 2) + (3, 4) = (4, 6)
引き算 同じ位置どうしを引く (5, 3) − (2, 1) = (3, 2)
スカラー倍 全成分に同じ数をかける 3 × (2, 5) = (6, 15)

ベクトルの内積|DS検定で最重要の演算

公式スキルチェックリストに「ベクトルの内積に関する計算方法を理解し、線形式をベクトルの内積で表現できる」とあります。内積は確実に出ると思ってください。

📐 内積の計算方法
a⃗ = (a₁, a₂)、b⃗ = (b₁, b₂) のとき

a⃗ · b⃗ = a₁×b₁ + a₂×b₂

同じ位置の成分どうしをかけて、全部足すだけです。

具体例で計算してみよう

a⃗ = (2, 3)、b⃗ = (4, 1) のとき

a⃗ · b⃗ = 2×4 + 3×1 = 8 + 3 = 11

これだけです。難しくないですよね。

内積は「2つのデータの似ている度合い」を測る道具

「で、内積って何の役に立つの?」と思いますよね。

内積は、2つのベクトルがどれくらい同じ方向を向いているかを数値化してくれます。音楽の好みで例えてみましょう。

🎵 音楽の好みで例えると…
Aさんの好み = (ロック: 5, ジャズ: 1) → ロック大好き
Bさんの好み = (ロック: 4, ジャズ: 2) → ロック好き
Cさんの好み = (ロック: 1, ジャズ: 5) → ジャズ大好き

AとBの内積 = 5×4 + 1×2 = 22(大きい → 好みが似ている!)
AとCの内積 = 5×1 + 1×5 = 10(小さい → 好みが違う)

このように、内積が大きいほど「似ている」と判断できます。これがレコメンドエンジン(おすすめ機能)の基本的な考え方です。
📘 関連記事
分散・標準偏差とは?意味と計算方法をゼロから図解 →

ベクトルの内積と共に、データの「バラつき」を測る分散・標準偏差もDS検定の必須知識です。

行列とは?——「データをまとめて処理する箱」

行列は、数字を長方形に並べたものです。Excelの表をイメージしてください。

📐 行列の表記(2×2行列の例)

A = ⎡ 1 2 ⎤
     ⎣ 3 4 ⎦

これは「2行2列の行列」です。横の並びを「行」、縦の並びを「列」と呼びます。

Excelで100人分のテストの点数(国語・数学・英語)を管理するとき、100行×3列の表を作りますよね。これがまさに「100×3の行列」です。データサイエンスでは、大量のデータを一つの行列としてまとめて計算することで、効率的に処理します。

行列の基本演算|足し算・スカラー倍・行列の積

行列の足し算(同じ位置を足すだけ)

⎡1 2⎤ + ⎡5 6⎤ = ⎡1+5 2+6⎤ = ⎡ 6  8⎤
⎣3 4⎦   ⎣7 8⎦   ⎣3+7 4+8⎦   ⎣10 12⎦

行列の積(ここが少しだけ複雑)

行列の積は、「左の行」と「右の列」の内積を計算して、その結果を新しい行列の対応する位置に入れる——というルールです。

⎡1 2⎤ × ⎡5 6⎤
⎣3 4⎦   ⎣7 8⎦

左上 = 1×5 + 2×7 = 5+14 = 19
右上 = 1×6 + 2×8 = 6+16 = 22
左下 = 3×5 + 4×7 = 15+28 = 43
右下 = 3×6 + 4×8 = 18+32 = 50

結果 = ⎡19 22⎤
       ⎣43 50⎦
🔧 DS検定で問われるレベル
行列の積の「計算過程を全部解け」というよりも、「行列の積は交換できない(A×B ≠ B×A)」という性質や、「行列の積が定義できる条件(左の列数=右の行数)」を理解しているかが問われます。手計算の速さよりも、概念の理解が大事です。

逆行列と行列式|「元に戻せるか?」の判定

割り算を思い出してください。「×3」の逆は「÷3」、つまり「×(1/3)」ですよね。行列にも同じ概念があり、これを逆行列と呼びます。

そして、逆行列が「存在するかどうか」を判定するのが行列式(determinant)です。

📐 2×2行列の行列式

A = ⎡a b⎤ のとき
    ⎣c d⎦

det(A) = ad − bc

この値が 0でなければ逆行列が存在し、0なら逆行列は存在しません。

具体例

A = ⎡2 3⎤ → det(A) = 2×5 − 3×4 = 10−12 = −2(≠0 → 逆行列あり)
    ⎣4 5⎦

B = ⎡1 2⎤ → det(B) = 1×4 − 2×2 = 4−4 = 0(→ 逆行列なし)
    ⎣2 4⎦
💡 線形代数のまとめ|ここだけ押さえればOK
✅ ベクトル = 方向と大きさを持つ数値の組
✅ 内積 = 同じ位置をかけて合計。「似ている度合い」を測る
✅ 行列 = 数値を長方形に並べたもの。データのまとめ処理に使う
✅ 行列の積 = 「左の行」×「右の列」の内積。交換法則は成り立たない
✅ 行列式 = ad−bc。0なら逆行列は存在しない

山②:微分・積分|「変化」と「合計」を読み解く道具

微分・積分と聞いて逃げ出したくなる人、安心してください。DS検定で問われるのは「微分・積分の"意味"がわかっているか?」であって、複雑な計算テクニックではありません。

微分とは?——「今この瞬間、どれくらい変化しているか」

車のスピードメーターを想像してください。

走行距離のグラフがあったとき、「今この瞬間、時速何キロで走っているか?」を知りたいですよね。そのグラフの「傾き」を求める操作が、微分です。

🚗

走行距離(元のグラフ)

時間とともに「どれだけ進んだか」の累計。グラフは右肩上がりのカーブ。

⏱️

速度(微分した結果)

「今この瞬間の変化の度合い」。つまりグラフの傾き。急な坂=速い、ゆるい坂=遅い。

📐 微分の核心(一言で)

微分 = 「グラフの傾き」を求めること

傾きが急 → 変化が大きい
傾きがゼロ → 変化なし(最大値 or 最小値の候補)

微分の基本公式|これだけ覚えておけばOK

DS検定で出る微分の計算は、多項式(xのn乗の足し算)の微分がほとんどです。ルールはたった1つ。

📐 微分の公式(べき乗の微分)

f(x) = xⁿ のとき、f'(x) = n × xⁿ⁻¹

「指数を前に持ってきて、指数を1つ減らす」だけです。

具体例

元の関数 f(x) 微分した結果 f'(x) 考え方
2x 2を前に出して、指数を2−1=1に
3x² 3を前に出して、指数を3−1=2に
3x² + 2x + 5 6x + 2 各項を微分。定数(5)は消える
7(定数) 0 変化しないもの → 傾きゼロ

偏微分|変数が2つ以上あるときの微分

現実のデータは変数が1つだけとは限りません。たとえば「気温」と「湿度」の2つの要因が「アイスの売上」に影響するとき、「気温だけ変えたら売上はどう変わる?」を知りたい。このとき、湿度は固定して、気温だけで微分する——これが偏微分です。

📐 偏微分のルール(一言で)

「注目する変数以外は、定数とみなして微分する」

例:f(x, y) = 3x² + 2xy + y² を x で偏微分
→ y は定数扱い → ∂f/∂x = 6x + 2y
🔧 なぜ微分がデータサイエンスで重要なのか?
機械学習のモデルは「予測の誤差(ロス)を最小にする」ことが目標です。この「誤差を最小にする方向」を見つけるために使われるのが微分(勾配降下法)です。「傾きがゼロの点=最小値(最適解)の候補」だからこそ、微分が必要なのです。

積分とは?——「合計」を求める操作

微分が「傾き(瞬間の変化)」を求める操作なら、積分はその逆で「合計(累積)」を求める操作です。

水道の蛇口を思い出してください。蛇口からの水量(毎秒○リットル)がわかっているとき、「1時間で何リットル溜まった?」を計算する——これが積分のイメージです。

🚿

水量の変化(関数)

「今この瞬間、毎秒何リットル出ているか」がグラフで表される。

🪣

溜まった量(積分の結果)

グラフの下の面積が、合計量を表す。これが積分。

📐 積分の核心(一言で)

積分 = 「グラフの面積」を求めること

統計学では、確率密度関数の「面積」が確率を表します。たとえば正規分布の曲線の下の面積が1(=100%)になるのは、積分の考え方によるものです。
💡 微分・積分のまとめ|ここだけ押さえればOK
✅ 微分 = グラフの「傾き」を求める操作。変化の速さを知る
✅ 基本公式:xⁿ → n×xⁿ⁻¹(指数を前に出して、1つ減らす)
✅ 偏微分 = 注目する変数以外を固定して微分
✅ 積分 = グラフの「面積」を求める操作。合計を知る
✅ 微分は機械学習の勾配降下法、積分は確率計算で使われる

山③:集合論|データの「グループ分け」を数学で表す

集合論は、3つの山の中で最もイメージしやすく、得点しやすい分野です。公式スキルチェックリストにも「ベン図を用いて説明できる」とあるように、ベン図(丸が重なった図)が理解の中心です。

集合とは?——「条件を満たすもののグループ」

集合とは、ある条件を満たすモノの集まりのことです。

スマホのフォトアルバムで考えましょう。「旅行の写真」というアルバムと「食べ物の写真」というアルバムがあったとき、それぞれが「集合」です。「旅行先で食べた料理の写真」は、両方のアルバムに入りますよね。これが集合の「重なり」です。

5つの集合演算|ベン図で覚えよう

DS検定で問われる集合演算は、以下の5つです。ここでは集合A(赤い丸)と集合B(青い丸)を使って説明します。

演算名 記号 意味 日常の例え
和集合 A ∪ B AまたはBのどちらか一方でも含むもの全部 「コーヒーか紅茶、どちらか好きな人」
積集合 A ∩ B AとB両方に含むもの 「コーヒーも紅茶も両方好きな人」
差集合 A − B Aには含むが、Bには含まないもの 「コーヒーは好きだけど紅茶は嫌いな人」
補集合 Aᶜ A以外のすべて 「コーヒーが好きではない全員」
対称差集合 A △ B 片方だけに含むもの(重なり以外) 「コーヒーか紅茶、どちらか一方だけが好きな人」
⚠️ 対称差集合は頻出!
DS検定の公式模擬問題集(PDF)でも、対称差集合のベン図問題が出題されています。「どちらか一方だけに属するもの」という意味を確実に覚えておきましょう。

具体例で計算してみよう

A = {1, 2, 3, 4, 5}、B = {3, 4, 5, 6, 7} のとき

演算 結果
A ∪ B(和集合) {1, 2, 3, 4, 5, 6, 7}
A ∩ B(積集合) {3, 4, 5}
A − B(差集合) {1, 2}
A △ B(対称差) {1, 2, 6, 7}

論理演算との対応|AND・OR・NOT

スキルチェックリストに「論理演算と集合演算の対応を理解している」とあります。プログラミングでお馴染みのAND/OR/NOTが、集合演算と対応しています。

集合演算 論理演算 意味
A ∩ B(積集合) AND 両方満たす
A ∪ B(和集合) OR どちらか満たす
Aᶜ(補集合) NOT 満たさない
💡 集合論のまとめ|ここだけ押さえればOK
✅ 集合 = 条件を満たすものの集まり
✅ 和集合(∪)= OR(どちらかに属する)
✅ 積集合(∩)= AND(両方に属する)
✅ 差集合(A−B)= Aにはあるが、Bにはない
✅ 補集合(Aᶜ)= NOT(Aに属さないすべて)
✅ 対称差集合(A△B)= 片方だけに属する(重なり以外)
✅ 集合演算 ↔ 論理演算(AND/OR/NOT)は対応している

まとめ|DS検定の数学は「3つの山」を丁寧に登れば怖くない

📋 この記事の要点
分野 核心キーワード 一言まとめ
線形代数 ベクトル・内積・行列・行列式 データを「数字の組」で表し、まとめて処理する道具
微分・積分 傾き・面積・偏微分 「変化の速さ」と「合計」を求める道具
集合論 ベン図・AND/OR/NOT データの「グループ分け」を数学で表す道具

大事なことなので、もう一度言います。DS検定の数学は、大学数学科の試験ではありません。

求められているのは「用語の意味がわかる」「基本的な計算ができる」「データサイエンスとの関連を理解している」の3点だけです。この記事で紹介した内容を理解していれば、数学分野の出題に対して十分に戦えるレベルに到達しています。

⚠️ 学習のコツ
数学は「読むだけ」では身につきません。必ず手を動かして計算例を1回やってみてください。この記事に載っている具体例をノートに書き写して計算するだけで、理解度が全然違ってきます。

🔗 公式リンク集

📚 次に読むべき記事

📘 【完全版】DS検定とは?試験概要・合格率・3領域を徹底解説 →

DS検定の全体像(日程・費用・合格率・他資格との比較)を網羅したピラー記事です。

📘 分散・標準偏差とは?意味と計算方法をゼロから図解 →

DS検定「統計数理基礎」の最重要トピック。数学の次はここを押さえましょう。

📘 検定の選び方|仮説検定の全体像をわかりやすく解説 →

DS検定「推定・検定」分野の攻略に直結する記事です。

タグ

-データサイエンティスト検定
-