刘鹏飞老师认为NLP目前为止经历了四个阶段(范式):完全监督机器学习完全监督深度学习预训练模型微调: 预训练->...[作者空间]
已知氨基酸X,Y,Z坐标 1. 利用切线,做小量近似,展开足够阶数 在三维坐标系中,对于两切线近似组成的平面,切线...[作者空间]
一.基本思路:局部距离替换高维空间距离 构建原始高维空间的距离直接采用了欧氏距离,但这在流形结构数据中往往有问题,...[作者空间]
一.算法介绍 层次聚类试图在不同层次对数据集进行划分,从而形成树形的聚类结构。数据集的划分有两种策略:一种是自下而...[作者空间]
一.奇异值分解定义 将一个非零的实矩阵,表示为如下三个实矩阵的乘积形式的运算,即进行矩阵的因子分解: 其中,是阶正...[作者空间]
一.距离度量 对于聚类,其实之前已经有算法涉及了,比如GMM,这一章开始再次做系统介绍。聚类的核心思想套用一句俗语...[作者空间]
相对论:速度快的事情 量子力学:物体小的事情 1. 量子化学(Quantum Chemistry)介绍 量子:量子...[作者空间]
基于结构的机器导向映射淀粉样蛋白序列空间揭示了未知的高溶解度序列簇 The amyloid conformatio...[作者空间]
1. PDB_ID列表数据爬虫&数据预处理工作 2. 共爬取到13299个PDB_ID 去除非标准氨基酸以及取消...[作者空间]
遗传算法(GA, Genetic Algorithm)是进化算法(EA, Evolutionary Algorit...[作者空间]
一.最大熵原理 最大熵的思想很朴素,即将已知事实以外的未知部分看做“等可能”的,而熵是描述“等可能”大小很合适的量...[作者空间]
Automatic Chemical Design Using a Data-Driven Continuous ...[作者空间]
PepBDB: a comprehensive structural database of biological...[作者空间]
图卷积发展至今,早期的进展可以归纳为谱图方法和非谱图方法,这两者都存在一些挑战性问题 谱图方法:学习滤波器主要基于...[作者空间]
展示帮助信息 The command output as below: 回到远程仓库的状态 抛弃本地所有的修改,回...[作者空间]
首先,标准化的英文是Standardization,归一化的英文是Normalization,正则化的英文是Reg...[作者空间]
Tajima D 这个是选择相关的一个参数,大于0代表群体观测杂合度高于预期杂合度,稀有等位基因频率降低(群体收缩...[作者空间]
变分自编码,英文是Variational AutoEncoder,简称VAE。它是包含隐变量的一种模型 变分自编码...[作者空间]
思考题1:什么是生物信息学,如何理解其含义?为什么在大规模测序研究中,生物信息学至关重要? 一、生物信息学有三个方...[作者空间]
不平衡数据集指的是数据集各个类别的样本数目相差巨大,例如2000的人群中,某疾病的发生只有100 (5%)人,那么...[作者空间]