人类语言处理
人类语言很复杂
- 包括文字和语音
- 56%的语言没有文字
- 1s就有16k个样本点,每个点有256个可能的取值
-
语音和文字很复杂
课程内容
这里的model就是deep network。
硬train一发
硬train一发之后,focus近3年的进展。
课程内容简介
语音辨识系统(automatic speech recognition, ASR)
语音辨识中的模型语音中的seq2seq和别的领域中不同。
语音合成(text-to-speech synthesis)
依然存在问题:在真实应用中,会出现问题。(在给单独的词时,google 小姐的破音)
语音分离(speech separation)
鸡尾酒会效应(cocktail party effect)
直接硬train一发就可以获不错的效果。
可以用来做变音器(voice conversion),例如柯南。
问题描述
Input audio, ouput class
- speaker recognition
-
keyword spotting(e.g., wake up words)
两类问题
文字生成 (Text generation )
BERT
BERT和他的朋友们
模型越来越大了。
文字生成可能的两种方式输入输出同时是文字
输入输出同时是文字的应用文法分析也可以看作文字到文字的应用
这部分内容,课程主要讲QA系统。
其他学习内容
-
Meta learning
学习如何去学习。
-
机器学习知识
image.png -
adversarial attack
image.png -
explainable AI
image.png
网友评论