主洋流提取过程介绍

作者: 云中翻月 | 来源:发表于2020-03-27 23:11 被阅读0次

主洋流提取过程介绍
提取图片主颜色及灰度图
洋流
XPath 基础学习
热带洋流
R语言data manipulation学习笔记之subset
主成分分析
颜研堂滴滴草本液介绍
如何提取图片主色
MySQL的主从复制配置

提取主方向洋流过程算法描述

1 问题简述

我们需要从200条洋流中选取四条最有“特征”（相互间差距最大）的洋流进行分镜头追踪。以下主要针对选取四条洋流的过程进行详细叙述。

2 解决思路

洋流是一条三维空间内的曲线，更准确地说，对于一条在延伸中的洋流，它拥有四个维度。即 $XYZ$ 坐标和当前时间。

也就意味着，我们在选择四条“特征”最明显的洋流时，要考虑这四条洋流的四个维度的“特征”是与其他洋流差距最大的。

为了准确的衡量这个“特征”，我们先选取一条基准洋流，然后将每条洋流的“特征”用两个变量 $\phi$ 和 $d$ 表示。其中 $\phi$ 表示当前洋流和基准洋流的主方向对应的极角差， $d$ 表示当前洋流和基准洋流在整个过程中的离散Fréchet（弗雷歇）距离。然后我们用一个线性组合来将 $<\phi,d>$ 的二元组合成为一个数字。对所有这样的数字进行排序后，在序列中选取等距离的四个点即是我们需要的四条洋流。（这四条洋流满足他们之间的主方向和距离差距最大）

注1：离散Fréchet（弗雷歇）距离常用于评价空间里两条曲线相似度。它的推导过程如下：
假设一条洋流的轨迹为 $P$ 且长度为 $N$ ，另一条洋流的轨迹为 $Q$ 且长度为 $M$ 。而两者运动位置的描述可以用一个 $t$ 变量的连续递增函数来刻画。用 $\alpha(t)$ 来表示一条曲线运动位置描述函数，用 $\beta(t)$ 表示另一条曲线运动位置描述函数。同时为了方便讨论，我们将变量 $t$ 约束到区间 $[0,1]$ 内，那么有 $\alpha(0)=0,\alpha(1)=N,\beta(0)=0,\beta(0)=M$ 。我们用 $P(\alpha(t))$ 和 $Q(\beta(t))$ 分别表示 $t$ 时刻两条曲线在各自轨迹上的空间位置，那么两条曲线之间的距离会随着 $\alpha(t)$ 和 $\beta(t)$ 函数本身的不同和变量 $t$ 的变化而不同，更为严格的Fréchet距离数学表达式如下：
$\delta_{F}(P,Q)=\min_{\alpha[0,1]\to[0,N]\\\beta[0,1]\to[0,M]}\{\max_{t\in[0,1]}d(P(\alpha(t)),Q(\beta(t)))\}$
注意到洋流由离散的点构成，因此考虑将上述公式拓展到离散Fréchet距离。
首先我们将上述两轨迹进行离散化，设曲线 $P$ 是由 $p$ 个轨迹点所组成，曲线 $Q$ 是由 $q$ 个轨迹点所组成。使用 $\sigma(P)$ 和 $\sigma(Q)$ 分别表示两轨迹点的顺序集合，则有 $\sigma(P)=(u1,...,up)$ 和 $\sigma(Q)=(v1,...,vq)$ 。同时，我们可以得到如下序列点对 $L$
$(u_{a_{1}},v_{b_{1}}),(u_{a_{2}},v_{b_{2}}),...,(u_{a_{m}},v_{b_{m}})$
其中， $a_{1}=1,b_{1}=1,a_{m}=p,b_{m}=q$ 。
$P、Q$ 轨迹点之间的序列对之间长度 $||L||$ 定义为各序列对中欧式距离最大的值，表达式如下
$\left||L\right||=\max_{i=1,...,m}d(u_{a_{i}},v_{b_{i}})$
那么其离散Fréchet距离定义如下
$\delta_{dF}(P,Q)=\min{\left||L\right||}$

注2：之所以选择 $\phi$ 和 $d$ 来做为洋流之间比较的依据，原因在于，主方向提取算法（PCA）能够处理一条曲线的方向，但在降维的过程中损失了“距离”这一要素。而 $d$ （离散Fréchet距离）的设置，弥补了这一不足。

一个简单的示意图

3 具体算法过程

3.1 第一步

使用PCA算法，对所有洋流提取主方向。（时间复杂度 $O(洋流总条数*一条洋流上的点数)$ ）

3.2 第二步

使用dbscan聚类算法，对PCA处理后得到的三维点云做聚类。最终将聚类后得到的点作为可能最终被选取洋流，不被聚类的点（边缘点）将被舍弃。（时间复杂度 $O(洋流总条数)$ ）

3.3 第三步

3.3.1 具体步骤一

在剩余的所有点代表的洋流中选取一条作为基准洋流（由于是差距比较，这里的选取可以任意而不影响结果）。（时间复杂度 $O(1)$ ）

3.3.2 具体步骤二

用基准洋流和剩下的所有可行洋流计算主方向的极角差 $\phi$ ，和离散Fréchet距离 $d$ 。（时间复杂度 $O(洋流总条数*一条洋流上的点数)$ ）

3.3.3 具体步骤三

用一线性组合 $res=\phi+kd$ 将 $\phi$ 和 $d$ 合成为一个数字 $res$ ，其中 $k$ 为指定常数。 $k$ 的选择决定了对 $\phi$ 和 $d$ 考虑的比重。（时间复杂度 $O(洋流总条数)$ ）

3.3.4 具体步骤四

对步骤三得到的所有 $res$ 进行排序，选取其中等距离的四个数字代表的洋流作为所要研究的洋流。（时间复杂度 $O(洋流总条数*log(洋流总条数))$ ）

4 总结

4.1 时空复杂度分析

所有涉及操作的空间复杂度均低于OceanView中其他过程的空间复杂度，因此这里并不会产生空间使用超限的问题。

所有涉及操作的时间复杂度的瓶颈在于第一步中的全过程PCA算法和3.3.2中的计算离散Fréchet距离。但这里的所有时间复杂度均为预处理过程中的开销，并不会影响渲染过程。

4.2 算法优势

通过考虑不同维度，较为完整的囊括了洋流的绝大部分信息，使得算法过程中的洋流选择更易使人理解。

4.3 算法劣势

算法中存在一个超参，即结合 $\phi$ 和 $d$ 的常数 $k$ 。常数 $k$ 的选择将最终影响四条洋流的选择。

主洋流提取过程介绍
提取主方向洋流过程算法描述 1 问题简述我们需要从200条洋流中选取四条最有“特征”（相互间差距最大）的洋流进行...
提取图片主颜色及灰度图
本文主要内容提取图片主颜色灰度图总结本文介绍两种常用的图象算法，一种是提取图片主颜色，另一种是灰度图。提取...
洋流
所有的声音都漂在海上在我四周我刚刚到达像一个婴儿握不紧手心
XPath 基础学习
1、准备学习在爬虫过程中，需要提取需要的元素，本文介绍了两种XPath方式： 1.1、Chrome consol...
热带洋流
我看到了整个世界的浮躁于是我把整个世界掩埋在沙土中然后在距离感知最真实的地方建起了自己的牢笼牢笼足够大里...
R语言data manipulation学习笔记之subset
数据分析过程中我们常常需要从数据集中抽取部分数据，本文将介绍如何提取子数据集，主要利用R自带的函数，以后会专门介绍...
主成分分析
案例关于中国历年国民经济主要指标的统计（1998-2005），试分析对这些指标提取主成分并写出提取的主成分与这些...
颜研堂滴滴草本液介绍
颜研堂滴滴草本液介绍成分:野山楂果提取物，野菊花提取物，掌叶大黄根提取物，广藿香提取物，连翘提取物! 1、...
如何提取图片主色
效果
MySQL的主从复制配置
一、写在前面上一篇文章中，我们介绍了MySQL的主主复制，由于时间仓促，并未完整、清晰地验证主主复制的全过程，缺...