美文网首页物理
chpt.2 熵和温度(1)

chpt.2 熵和温度(1)

作者: 有限与微小的面包 | 来源:发表于2019-12-23 17:08 被阅读0次

    \boldsymbol{\mathrm{I}}. 基本假设

    热物理基本假设:封闭系统中所有可获得的量子态均是等概率的。——没有理由倾向只选择其中的某一些而非另外一些态。

    (一个十分民主的假设,哈哈哈)

    假设中值得注意的有两点:

    \bullet封闭系统(closed system),表明系统的总能量、微粒总个数、体积以及其他一切可能对系统造成影响的外界参数(比如引力场,电、磁场等)统统保持不变。

    \bullet如果一个量子态是可获取的(accessible),说明该态在时间尺度上与系统存在关联性,或其特征与系统的物理规格兼容。

    在时间尺度上存在关联很好理解。比如我们知道,石墨的热稳定性大于钻石;但石墨仍存在着自发变为钻石的可能,只是概率非常非常小,小到等待它发生所需要的时间将远远超出宇宙年龄。在这种情况下我们就会说这种量子态在是不可获取的,因为它不存在时间尺度上的关联性。(这也是化学反直觉的地方之一,因为几乎绝大部分事物都可以理解成是一种概率分布)

    另外一个例子,设想一个孤立系统(比如一个完全封闭的绝缘盒);盒子里的气体分子有可能会自发地全部聚集在盒子内一点并形成一个很小的黑洞,但我们在进行实验操作时并不会考虑该情况的出现,因为这种态发生的概率同样也非常非常的小,小到在时间尺度上不存在任何关联。

    后者主要是考虑了一个系统在某些时候会存在的一些不常见的性质,这些性质就有可能导致系统的某些态无法被观测到。比如,在低温情况,二氧化硅(\mathrm{SiO}_2)的结晶态在任何从琉态或非晶态出发的观测下都是不可获取的——低温下的熔融石英玻璃在我们有生之年都不会自发变为石英结晶。

    所以,我们倾向于将所有不可获取的量子态称为零概率的态。它们是可能的,但概率为零。

    \bullet当然,我们也可选择只将那些可获取的量子态算入我们的研究范畴,将那些我们不感兴趣的量子态的统计特性排除在外。这样一来,这个新规定的系统将不会出现任何因为无法获取而导致的问题。


    \boldsymbol{\mathrm{I\!I}}. 概率

    (i)有一个封闭系统,它会在等概率的情况下变成g个可获取的量子态中的任意一个。如果我们用s来表示这些量子态的序标,那么该封闭系统处于s态的概率为:

    P(s) = \frac{1}{g}

    \bullet如果量子态s是不可获取的,P(s) = 0。可见,如刚才提到过的,即便将这些不可获取的态排除在外也不会影响总概率。

    (ii)所有态的概率之和为一,即

    \sum_s P(s) = 1

    (iii)考虑系统的一个物理量X,如果可以将其表示为跟态s有关的函数X(s),它的平均值可以用含有概率的表达式定义:

    \left<X\right> = \sum_s X(s)P(s)

    \bullet对于封闭系统,根据我们的基本假设,有

    \left<X\right> = \sum_s X(s)\left(\frac{1}{g}\right)

    形如这样的平均值属于系综平均(ensemble average)——我们创造g个相似系统,每个系统都会对应一个可获取态。于是我们将这个由这些相似系统组成的群体称为系综(ensemble of systems)。所以任何属于系综的物理量的平均值则被称为该物理量的系综平均。

    \bullet一个系综由许许多多的系统组成,而这些系统彼此间都是相似的。系综里的每一个系统都是实际系统中一个可获取态的复制。也就是说,如果实际系统一共有g个可获取态,那么系综也将由g个近似系统组成。

    \bullet系综里的系统与实际系统在运算上完全等价;每一个系统都满足所有施加在实际系统之上的外部条件。

    \bullet实际系统的每一个可获取态均由系综里一个系统的稳定态表示。

    (例)

    一个N = 5,自旋余量2s = 1的系统可以用以下系综代替:

    \big\uparrow\big\uparrow\big\uparrow\big\downarrow\big\downarrow

    \big\uparrow\big\downarrow\big\uparrow\big\uparrow\big\downarrow

    \big\uparrow\big\uparrow\big\downarrow\big\uparrow\big\downarrow

    \big\downarrow\big\uparrow\big\uparrow\big\uparrow\big\downarrow

    \big\uparrow\big\uparrow\big\downarrow\big\downarrow\big\uparrow

    \big\uparrow\big\downarrow\big\uparrow\big\downarrow\big\uparrow

    \big\downarrow\big\uparrow\big\uparrow\big\downarrow\big\uparrow

    \big\uparrow\big\downarrow\big\downarrow\big\uparrow\big\uparrow

    \big\downarrow\big\uparrow\big\downarrow\big\uparrow\big\uparrow

    \big\downarrow\big\downarrow\big\uparrow\big\uparrow\big\uparrow

    系综里的每一个系统都具有相同的能量,它们分别对应真实系统里的一个可获取态。它们的个数可由重性函数得到:

    g(5,\frac{1}{2}) = \frac{5!}{3!2!} = 10


    \boldsymbol{\mathrm{I\!I\!I}}. 最可能位形

    现在有两个系统:\mathcal{S}_1\mathcal{S}_2,分别具有能量U_1U_2。它们稍后被调整为了相互接触的状态,使得彼此的能量能够自由传递。我们把这种接触称为热接触(thermal contact)

    接触在一起的两个系统形成了一个新的封闭系统\mathcal{S} = \mathcal{S}_1 + \mathcal{S}_2。新系统具有能量U = U_1 + U_2,它是保持不变的。

    于是,一个很自然的问题产生了:究竟是什么决定了这两个系统之间能量的净流动?

    能量流动的方向不可能单单取决于系统能量的大小,因为系统的尺寸和组成可以存在很明显的差异。这一问题会直接将我们引导至之后对“温度”这一概念的定义。

    但在此之前,让我们先考虑能量分配的问题。

    \bullet合系统的总能量有多种分配方式,其中最可能的一种分配方式就是要能够使得系统可获取态的总数达到最大。

    就以两个自旋系统的热接触为例。这两个自旋系统的自旋个数分别为N_1N_2(可能不同),自旋余量为2s_12s_2(可能不同)。每个自旋都具有磁矩大小m。实际系统之间的能量交换可能是由于某些残余的弱耦合效应,但这其实无关紧要。

    合系统的自旋余量为2s,其中s = s_1 + s_2。合系统具有的能量可表示为跟自旋余量有关的函数:

    U(s) = U_1(s) + U_2(s) = -2mB(s_1 + s_2) = -2mBs

    合系统的总自旋数:

    N = N_1 + N_2

    如果我们假设两个系统的能级间隔均为2mB,将系统\mathcal{S}_1中的一个上旋反向等同于将系统\mathcal{S}_2中的下旋反向,能量交换将总是可能的。因为总能量是一个常数,所以s = s_1 + s_2也是一个常数;但当两个系统被调整为热接触的瞬间,它们各自的自旋余量s_1s_2和能量U_1U_2都有可能被重新分配。

    对于第一个系统,它的自旋余量为2s_1;第二个系统的自旋余量为2s_2。我们把拥有确定s_1以及s_2的值的所有态的集合称为位形(configuration)。根据定义,我们可以看出,位形并非某一个系统的状态,而是两个系统作为整体的合系统的状态。第一个系统有g_1(N_1,s_1)个可获取的量子态,这些量子态可以与第二个系统的g_2(N_2,s_2)个量子态随意组合,所以一个位形里所有可能的态应该为二者的乘积(具体原因可以看看chpt.1 系统模型的态(2))。又因为s_2 = s - s_1

    于是,合系统的其中一种位形可以表示为:

    g_1(N_1,s_1)g_2(N_2,s-s_1)N_1 < N_2)。

    s_1取不同的值时,g_1(N_1,s_1)g_2(N_2,s-s_1)表示了合系统不同的位形。

    \bullet如果我们将所有s_1取值所对应的合系统位形全部加起来,我们可以得到合系统在某个固定能量的全部位形的所有态的个数:

    g(N,s) = \sum_{s_1 = -N/2}^{N/2}g_1(N_1,s_1)g_2(N_2,s-s_1)

    它也是合系统的重性函数。

    我们假设两个系统重性函数的乘积在s_1达到某个值时取得最大,我们把这个s_1的值用\hat{s}_1表示,我们把取得最大值所对应的位形称为最可能位形(most probable configuration)。它可以被表示为:

    g_1(N_1,\hat{s}_1)g_2(N_2,s- \hat{s}_1)

    当系统足够大时(N足够大),合系统的重性函数将会在\hat{s}_1处出现尖峰:

    合系统的重性函数在能量U_1达到某个值时取得了最大值,此时合系统的统计特性只有极少数的几个位形支配。最可能位形将用于描述合系统的统计特性。

    不要觉得奇怪,这种尖峰是每一个拥有确切解的现实系统都具有的特征。在统计物理中,我们通常认为,尖峰的出现是任何大系统都具有的一般性质。从chpt.1 模型系统的态(4)中我们已经了解到,重性函数的尖峰越尖,系统关于最可能位形的分数涨落就越会小,所以系统在最可能位形通常是非常稳定的。同样地,任何大系统的物理特征的平均值都可以用该系统的最可能位形的平均值描述,我们把这样的平均值称为热平衡值(thermal equilibrium values)

    接下来我打算用一个例子来具体说明。

    让我们考虑两个处于热接触的自旋系统。根据重性函数的定义(chpt.1 模型系统的态(3)),合系统的某一位形所具有的所有态可以表示为:

    g_1(N_1,s_1)g_2(N_2,s_2) = g_1(N_1,0)g_2(N_2,0)\exp\left(-\frac{2s_1^2}{N_1} - \frac{2s_2^2}{N_2}\right)

    根据关系s_2 = s - s_1,做代换后得到:

    g_1(N_1,s_1)g_2(N_2,s - s_1) = g_1(N_1,0)g_2(N_2,0)\exp\left(-\frac{2s_1^2}{N_1} - \frac{2(s - s_1)^2}{N_2}\right)

    当合系统的自旋余量2s以及两个系统的自旋数目N_1N_2都确定时,我们可以将上式看成一个仅关于s_1的函数。我们想要找出使得这个函数取得最大值时s_1的值。又因为函数y(x)与它的对数\log y(x)都在同一处取得最大值:

    \log g_1(N_1,s_1)g_2(N_2,s - s_1) = \log g_1(N_1,0)g_2(N_2,0) - \frac{2s_1^2}{N_1} - \frac{2(s - s_1)^2}{N_2}

    我们不妨先考虑对数的最大值。

    对上面的表达式求关于s_1的偏导:

    \frac{\partial}{\partial s_1}\left\{\log g_1(N_1,s_1)g_2(N_2,s - s_1) \right\} = -\frac{4s_1}{N_1} + \frac{4(s-s_1)}{N_2} = 0

    这个等式的解就是使得对数取得驻值的s_1的值。它同时也是最大值,因为:

    \frac{\partial^2}{\partial s_1^2}\left\{\log g_1(N_1,s_1)g_2(N_2,s - s_1)\right\} = -4\left(\frac{1}{N_1}+\frac{1}{N_2}\right)

    小于零。

    于是,

    \frac{s_1}{N_1} = \frac{s-s_1}{N_2} = \frac{s_2}{N_2}

    我们得出结论:当两个热接触的系统处于热平衡时,它们的能量比将等于自旋余量比

    如果我们用\hat{s}_1\hat{s}_2来表示最可能位形所对应的值,则

    \frac{\hat{s}_1}{N_1} = \frac{\hat{s}_2}{N_2} = \frac{s}{N}

    \bullet计算最可能位形具有的态总数,只需将其代入合系统的重性函数:

    (g_1g_2)_{\text{max}} \equiv g_1(\hat{s}_1)g_2(s - \hat{s}_1) = g_1(N_1,0)g_2(N_2,0)\exp{(-2s^2/N)}

    \bullet分析重性函数的锐度,让我先定义一个涨落值\delta。这个值代表了s_1s_2\hat{s}_1\hat{s}_2相比偏离的多少。于是:

    s_1 = \hat{s}_1 + \delta;\quad s_2 = \hat{s}_2 - \delta

    s_1^2 = \hat{s}_1^2 + 2\hat{s}_1\delta + \delta^2; \quad s_2^2 = \hat{s}_2^2 + 2\hat{s}_2\delta + \delta^2

    代入合系统的重性函数g_1(N_1,s_1)g_2(N_2,s_2)

    g_1(N_1,s_1)g_2(N_2,s_2) = g_1(N_1,0)g_2(N_2,0)\exp\left(-\frac{2(\hat{s}_1^2 + 2\hat{s}_1\delta + \delta^2)}{N_1} - \frac{2(\hat{s}_2^2 + 2\hat{s}_2\delta + \delta^2)}{N_2}\right)

    整理后可得:

    g_1(N_1,0)g_2(N_2,0)\exp(-\frac{2(\hat{s}_1^2+\hat{s}_2^2)}{N_1})\exp(-\frac{4\hat{s}_1\delta}{N_1}+\frac{4\hat{s}_2\delta}{N_2}-\frac{2\delta^2}{N_1}-\frac{2\delta^2}{N_2})

    我们发现,常数部分其实等于(g_1g_2)_{\text{max}},并且\frac{\hat{s}_1}{N_1} = \frac{\hat{s}_2}{N_2}

    所以最终可以得到:

    g_1(N_1,s_1)g_2(N_2,s_2) = (g_1g_2)_{\text{max}}\exp(-\frac{2\delta^2}{N_1}-\frac{2\delta^2}{N_2})

    \bulletN_1N_2都非常大时,在\hat{s}_1附近它将会是一个非常非常尖的峰。

    下面我用具体数字来说明。

    假设N_1 = N_2 = 10^{22}\delta = 10^{22},二者的比值\frac{\delta}{N_1} = 10^{-10}

    所以\frac{2\delta^2}{N_1} = 200g_1g_2的乘积将减小为峰值的e^{-400} \approx 10^{-174}倍,这是非常非常夸张的变化。可见,在峰值处的g_1g_2锐度非常大。

    \bullet已知系统位形距最可能位形的偏差值,如果我们想要知道其出现的概率是多少,可以直接对

    g_1(N_1,s_1)g_2(N_2,s_2) = (g_1g_2)_{\text{max}}\exp(-\frac{2\delta^2}{N_1}-\frac{2\delta^2}{N_2})

    进行积分运算。

    比如,如果我想要知道分数偏差至少为\frac{\delta}{N_1} = 10^{-10}的概率,积分的下限将为\delta = 10^{12};上限为\delta = \infty

    (g_1g_2)_{\text{max}}\int_{\delta = 10^{12}}^{\infty}e^{-2\left(\frac{1}{N_1}+\frac{1}{N_2}\right)\delta^2}d\delta

    对于余误差函数(complementary error function),我们通常采用渐进展开来近似:

    2xe^{x^2}\int_x^{\infty}e^{-t^2}dt \approx 1 + \xi

    其中\xi为小量。

    换元后可以解得概率的上限为N \times 10^{-174} = 10^{-152}。即,分数偏差大于10^{-10}的概率只有10^{-152}

    换句话说,系统处于任何至少偏差了最可能位形\delta = 10^{12}的概率是系统处于热平衡状态的\frac{1}{10^{152}}

    这个概率有多吓人呢?它小到你永远都不会观测到系统处于任何只偏差了最可能态大约10^{-10}的其他态。实验设备再精良,操作再娴熟,也是实验者永远观测不到的。取10^{152}个相似系统作为样本进行实验,就算以每样本一皮秒(10^{-12}秒)的速度进行重复抽取(已经非常夸张了),做完整个实验都需要花费我们10^{140}秒!这是一个长到有些好笑的时间……它有多长呢?我们知道,宇宙年龄不过才138亿年,换算一下也就只有10^{18}秒而已,连人家零头都算不上。如果连这你都觉得配不上“永不发生”四个字,那你最好别进赌场。

    只有当系统足够小时,我们才倾向于认为有机会能观测到分数偏差。比如位于悬着液滴中的小分子布朗运动;或者一个只含10个自旋的小系统,当它与一个大热源系统(U较高)进行热接触时,合系统在最可能位置产生的波动才将是比较可观的。


    相关文章

      网友评论

        本文标题:chpt.2 熵和温度(1)

        本文链接:https://www.haomeiwen.com/subject/upeinctx.html