02. 随机变量及其概率分布的核心概念与应用

1. 随机变量与概率分布的基本概念

1.1. 随机变量 (Random Variable, r.v.)

核心定义：随机变量是定义在样本空间上的一个实值函数，通常用大写字母表示。它的本质是将随机试验的每一个可能结果（样本点）映射到一个具体的数值。
作用：将复杂的、非数值的随机事件问题，转化为对数值函数的分析，从而可以使用微积分等数学工具进行研究。

1.2. 随机变量的分类

根据随机变量可能取值的特征，可以分为两类：

离散型随机变量 (Discrete random variable)：其全部可能取值是有限个或可列无限多个。
- 用例：一天内某餐厅的顾客数量、抛硬币 10 次出现正面的次数。
连续型随机变量 (Continuous random variable)：其全部可能取值可以充满一个或多个区间，是不可数的。
- 用例：一辆公交车的等待时间、一个电子元件的寿命。

1.3. 概率分布 (Probability Distribution) 的描述

概率分布描述了随机变量取所有可能值的概率规律。不同类型的随机变量有不同的描述工具。

描述工具	适用类型	核心性质
概率质量函数 (PMF) Probability Mass Function	离散型	1. 非负性： 2. 规范性：
概率密度函数 (PDF) Probability Density Function	连续型	1. 非负性： 2. 规范性：
累积分布函数 (CDF) Cumulative Distribution Function	通用	1. 非减函数 2. , 3. 右连续

重点辨析：PDF 的含义

对于连续型随机变量及其概率密度函数：

本身不是概率！ 事实上，对于任意一点，有。
的值反映了概率在点附近的“密集程度”或“浓度”。的值越大，意味着取值在附近的概率越高。
用例：假设代表某城市成年男性的身高（单位：米），其 PDF 为。如果，这并不意味着身高恰好为 1.75 米的概率大于 1.90 米的概率（两者都为 0），而是意味着身高在 1.75 米附近一个很小区间内（如）的概率，要大于身高在 1.90 米附近一个同样大小区间内（如）的概率。

CDF 的重要应用 对于任意随机变量，其 CDF 为，则计算区间概率的核心公式为：

对于连续型随机变量，由于单点概率为 0，所以。

2. 随机变量的数字特征

数字特征是用少数几个数字来概括概率分布的某些关键方面。

2.1. 数学期望 (Mathematical Expectation)

定义：也称为均值 (Mean) 或期望值 (Expected Value)，记为。它代表了随机变量取值的“加权平均值”或“长期平均水平”。
- 离散型：
- 连续型：
函数期望：对于，其期望为：
- 离散型：
- 连续型：

2.2. 方差 (Variance) 与标准差 (Standard Deviation)

定义：方差描述了随机变量取值相对于其期望值的离散程度或波动性，记为或。
- 离散型：
- 连续型：
标准差 (Standard Deviation, SD)：，量纲与随机变量本身相同，更具解释性。

2.3. 重要性质与计算公式 (常考)

期望的线性性质：对于常数，有
方差的性质：对于常数，有注意：常数不影响离散程度，因此被消除；系数被平方。
方差的常用计算公式：这是一个极其重要的公式，能极大简化计算。它将计算方差的问题，转化为了计算的期望和的期望。

3. 常见的离散型分布

分布名称 (Notation)	背景描述	概率质量函数 (PMF)
伯努利分布 Bernoulli ()	单次试验，只有“成功”(1) 和“失败”(0) 两种结果，成功概率为。	,
二项分布 Binomial ()	重独立的伯努利试验中，“成功”事件发生的总次数。	,
几何分布 Geometric ()	在一系列独立伯努利试验中，首次“成功”时所需要的试验次数。	,
泊松分布 Poisson ()	单位时间/空间内，某独立随机事件发生的次数，为平均发生率 (强度)。	,

重点辨析与应用

几何分布的无记忆性 (Memoryless Property)
- 定义：对于，有。
- 解释：已知一个事件已经失败了次，那么它在未来还要再失败次的概率，与从一开始就需要失败次的概率是完全一样的。简言之，“过去的失败不影响未来的概率”。
- 用例：赌徒谬误 (Gambler's Fallacy) 一个赌徒在玩大小游戏，连续开了 10 把“小”。他认为“小”已经出现太多次了，下一把开“大”的概率会非常高。这是错误的。如果每次开大小都是独立的随机事件（符合几何分布/伯努利试验的前提），那么无论之前开过多少次“小”，下一次开“大”的概率仍然是（通常是接近 0.5），不会改变。
泊松定理：二项分布的泊松近似 (常考)
- 结论：当二项分布中，很大且很小时，其概率可以由泊松分布近似计算，其中。
- 经验法则：通常当且时，近似效果很好。
- 用例：某保险公司有 2500 名客户，每位客户在一年内死亡的概率为 0.002。计算该公司一年内赔付不超过 5 次的概率。
  - 这里 (很大)， (很小)。
  - 精确计算是二项分布，非常复杂。
  - 可以使用泊松近似，令。设死亡人数为，则。
  - ，计算大为简化。

4. 常见的连续型分布

分布名称 (Notation)	背景描述	概率密度函数 (PDF)
均匀分布 Uniform ()	在区间内取值，且取任意子区间的概率只与该子区间长度有关（等可能性）。	,
指数分布 Exponential ()	独立随机事件两次发生之间的时间间隔，为单位时间内的平均发生率。	,
正态分布 Normal ()	又称高斯分布，自然界和工程中大量现象的理想模型（如误差、身高、测量值）。是中心位置，是离散程度。

重点辨析与应用

指数分布与泊松分布的关系
- 如果单位时间内事件发生的次数服从泊松分布，那么事件发生的时间间隔就服从指数分布。
- 期望的直观理解：若平均每小时有个顾客到达（泊松），那么平均每位顾客的到达时间间隔就是小时（指数）。
指数分布的无记忆性 (Memoryless Property)
- 定义：对于，有。
- 解释：一个元件已经正常工作了小时，它还能继续工作至少小时的概率，和一个全新的元件能工作至少小时的概率是相同的。简言之，“寿命不受已使用时间的影响”。
- 用例：“500 年一遇”的暴雨 新闻报道某地发生了“500 年一遇”的暴雨。这是否意味着从现在开始，500 年内不会再发生同等级别的暴雨？
  - 错误。如果这类事件的发生间隔可以近似看作服从指数分布，那么根据无记忆性，无论上次暴雨发生在昨天还是 100 年前，下一次发生这种暴- 雨的概率模式是完全一样的。“500 年一遇”仅表示其年发生率的倒数是 500，即年发生概率为。
正态分布的核心工具：标准化 (Standardization)
- 目的：任何一个普通正态分布都可以通过线性变换，转化为标准正态分布 。标准正态分布的 CDF，记为，有现成的表格可查。
- 核心公式：
- 概率计算：
- 对称性：

5. 随机变量的函数变换

研究已知随机变量的分布，如何求其函数的分布。

5.1. 离散型情况

直接根据的取值，合并对应取值的概率即可。

5.2. 连续型情况 (常考)

5.2.1. CDF 法 (通用方法)

这是最基本、最通用的方法，尤其在非单调时必须使用。

写出的累积分布函数定义：。
将代入：。
根据的性质，将不等式转化为关于的不等式。
利用的 CDF 或 PDF 计算出该概率，得到的表达式。
求导得到的概率密度函数：。

用例：设，求的分布。
1. ，对于。
2. 。
3. 。
4. 代入，可得 (对于 )。这是自由度为 1 的卡方分布。

5.2.2. 公式法 (仅限严格单调函数)

如果是严格单调函数，其反函数为，且可导。

注意：一定要乘以导数的绝对值 。

5.3. 琴生不等式 (Jensen's Inequality)

这是一个关于期望和函数变换的重要不等式。

如果是一个凸函数 (Convex Function)，则。
如果是一个凹函数 (Concave Function)，则。
重要推论：因为是凸函数，所以。这与方差公式相吻合。

1. 随机变量与概率分布的基本概念​

1.1. 随机变量 (Random Variable, r.v.)​

1.2. 随机变量的分类​

1.3. 概率分布 (Probability Distribution) 的描述​

2. 随机变量的数字特征​

2.1. 数学期望 (Mathematical Expectation)​

2.2. 方差 (Variance) 与标准差 (Standard Deviation)​

2.3. 重要性质与计算公式 (常考)​

3. 常见的离散型分布​

4. 常见的连续型分布​

5. 随机变量的函数变换​

5.1. 离散型情况​

5.2. 连续型情况 (常考)​

5.2.1. CDF 法 (通用方法)​

5.2.2. 公式法 (仅限严格单调函数)​

5.3. 琴生不等式 (Jensen's Inequality)​