语言学习拙见
从实际的项目中进行学习,是我的学习理念,学习语言也是一样,从实际的文本中进行学习是一种比较高效的学习方式。看语法书、背单词,然后再去阅读文本,我认为这是本末倒置,和人类的认知规律不符合。
假如说索尼大法星有一种外星生物,他们的语言只有四种字母,×、○、□、△,而他们的单词不超过两个字母,他们的语言有以下几种字母组合是有意义的单词,×:不,○:我,□:你 ,△:东西,××:想,○○:有,□□:饿,△△:渴,×○:吃,×□:喝,其他的概念暂时还没有开发出来,该物种只有最基本的自我意识,以及表达最基础的生物反应。他们句子的单词与单词之间用=连接。这时候你看到一篇外星文章:
○=×=□□
○=×=△△
□=□□
○=○○=△
□=×○
这篇文章的意思就是:我不饿,我不渴,你饿吗?我有东西,你吃吗?通过一篇文章,你习得了○、×、△、□、□□、△△、×○等单词,在此例中,占到了其基本单词的70%,除此以外更重要的是,你看到了这些词汇的具体使用场景和一些语法的规则,比如说叫x放在“感觉词”之前作为否定词。
当然语言学习的困难之处便在于,只掌握基本的单词是远远不够的,因为基本的单词可以通过组合衍生出许多新的概念,有些时候靠基本单词的本意并不能够猜测出组合之后的意思。比如说,英语中give和up,都是再简单不过的单词,但是放在一起give up,就有了特定的意思,虽然说和give、up本身的词义之间并非没有关联,但是也绝不是显而易见地就能从give和up单独的意思中来推断出其组合之后的含义。
再举一例,有个老外听别人说3000常用汉字能覆盖99%的汉语文章,于是他搞了本汉字的字典,闭关三年,把3000汉字学了个遍。终于有一天,他能倒着写“神”和“经”两个字,知道这两个字单独的意思,而且每个字都背了其中4、5种释义,他觉得自己已经能够看懂99%的汉语文章,他找来一篇文章,一来就看到两个字“神经”,他的大脑开始飞速运算,他想着‘神’的意思:god、spirit、clever等等。‘经’的意思:warp、longitude、manage、 as a result of、through等等,神+经,他左思右想,“god longitude(神的经度)?、clever manage?(很神的经营)、spirit through(神灵经过)?等等”。当然他是不会猜对的。
甚至拿索尼大法星球的语言来说,虽然就十个基本单词,但是他们还是由此发展出了不少的俚语,甚至是成语,比如说□=□=△=△(饿饿渴渴,意思是饥肠辘辘又口渴)、○=□□=□=×○(我饿你吃,指对方不讲情面)、×○=×□=○○=△(吃喝有东西,意思是生活很富足)。
从上面的例子可以看出,把单词作为语言学习的基本单位显然是不够的,单词的颗粒度太小了,根本不是我们平时说话的基本单位。
就拿上面的这句话来举例,基本单位绝对不是一个个孤立的汉字,而是:上面的例子、语言学习、不够的、基本单位、颗粒度、平时说话,这些好比是一个个点,通过“线”把这些点串联起来,形成了我们能够理解的概念。线是描述点之间的关系,比如整体和部分的关系、原因和结果的关系、位置和方向的关系等等。上面的这句话中,“线”就是:从...出(从...[可以/能够][看/听..]出),把...作为,是/不是。学习一门语言,就是要把握住它的点和线,其中点显然不仅仅是孤立的单词,它应该是你生活中常用到的概念,通常情况下,是字或者说单字的组合。除了点和线,很多语言还要加上一个时间的维度,那就是时态、动词变化等方面的内容。
另外,也没必要先去把八百年都用不到的单词背的滚瓜烂熟。有些人学英语,他知道30年以内只会碰到一次的幽闭恐惧症的单词是claustrophobia,但他不知道天天看到的床头柜英语怎么说,这恰恰是许多国内英语学习者都在走的偏门。花80%的时间去学20%的机会才会使用的单词,当然是得不偿失。
我认为一个比较好的书面语言学习平台便是维基百科(口语和书面语在许多语言里都有一定程度甚至是相当程度的差异),维基百科的优势在于它的同一个知识点或者说概念,综合了各种语言的版本,大体上,这个概念本身的含义是稳定的,你可以先去理解你所熟悉的语言对某个概念的解释,进而再去看你想学的那一门语言对这个概念的解释,在参照下进行学习,并且保证首先自己对这个概念的理解不会产生太大的偏差。
备注:索尼大法星球的外星人键盘
索尼大法星球的外星人所使用的交流工具学习素材示例
这里先选择一段维基百科的示例来演示我的语言学习方法,选取的是“neural network”词条。本身我只会一点点日语,现在我试图在不了解任何日本语语法和词汇的前提下,理解这段文本的含义,并且将其中的点和线整理出来。
ニューラルネットワーク(神経回路網)は、脳機能に見られるいくつかの特性を計算機上のシミュレーションによって表現することを目指した数学モデルである。研究の源流は生体の脳のモデル化であるが、神経科学の知見の改定などにより次第に脳モデルとは乖離が著しくなり、生物学や神経科学との区別のため、人工ニューラルネットワーク(人工神経回路網、artificial neural network, ANN)とも呼ばれる。
第一步:了解大意
通过中文或者英文的该词条,了解其大概的意思
这里摘选一段英文版的释义:Artificial neural networks (ANNs) or connectionist systems are a computational model used in machine learning, computer science and other research disciplines, which is based on a large collection of connected simple units called artificial neurons, loosely analogous to axons in a biological brain. Connections between neurons carry an activation signal of varying strength.
这一段话无非就是在解释神经网络是什么、由什么组成、在何处运用以及进一步解释组成它的元素有什么作用。原文中的大意就是人工神经网络是一种计算模型,它由大量的人工神经元连接而构成,在这些人工神经元之间的连接的作用是传递不同强度的信号。
通过谷歌翻译,了解其大意
这里仅摘录第一句话的谷歌翻译,使用日语翻译英语,经过测试,感觉准确性高于日语翻译成中文。
这句话的意思是:人工神经网络是一种数学模型,旨在将大脑功能中的一些特质,通过计算机模拟表现出来。
第二步:寻找断点
再复杂的句子也是由基本的元素所构成的,把一个句子拆解开,把里面的零件找出来,进而再观察零件之间的关系。
断点
- 次第
- 乖離
- 呼ばれる
- ニューラルネットワーク(neural network)
- シミュレーション(simulation)
- 人工ニューラルネットワーク(artificial neural network)
- モデル(model)
- 見られる
- いくつか
- によって
- する
- である
- など
- により
- とも
神経回路網は、脳機能に見られるいくつかの特性を計算機上のシミュレーションによって表現することを目指した数学モデルである。
第一句话,明显是在解释什么是神经回路网,也就是说如果你要解释一样东西的时候,就可以套用它的句式:
神経回路網は、数学モデルである。(神经网络是一种数学模型)
****东西は、释义である。*
第一句话剩下没搞明白的地方也就剩下脳機能に見られるいくつかの特性を計算機上のシミュレーションによって表現することを目指した这部分了,继续打断点。
脳機能に見られるいくつかの特性を計算機上のシミュレーションによって表現することを目指した
計算機上のシミュレーション(计算机上的Simulation)
脳機能
見られる:「見られる」和「見える」用哪个?
いくつかの特性(一些特性)
いくつか是什么意思
によって:によって(は)
目指し:目指し是什么意思
表現する:详细解说不寻常的学习日语词する
ことを:ことは、ことが、ことを 、 のは、のが、のを 有什么区别和规律吗?
断点之间的连接词相对于断点本身而言更为难找,因此在这里划分的断点很可能并不准确。而且由于参考的样本太少,还不足以把其中的语言规律给总结出来。但是结合多种参考素材(如谷歌翻译、维基百科相同词条的不同语言版本),还是能够比较接近地猜测出原文的含义,并且同时积累下相应的断点表达。打完断点之后的上述语句如下:
【脳機能】に【見られる】【いくつかの特性】を【計算機上のシミュレーション】【によって】【表現する】【ことを】【目指し】た
先暂且不论上述语句中概念之间的关系,只看有哪些概念被涉及:大脑机能(脳機能)、看到(見られる)、一些特性(いくつかの特性)、计算机模拟(計算機上のシミュレーション)、目的(目指し),(表現)表現する
前面已经说,神经网络本质上是一种数学模型(神経回路網は、数学モデルである),那么这里的一段话应该类似于定语,描述神经网络究竟是怎样的一种数学模型。根据已知的内容,有理由猜测,上述整段话,主体有两个部分:
A:在大脑机能中所观察到的一些特性
B:计算机模拟
这两个部分之间的关系是通过B表现出A,并且“通过B表现出A”即是该数学模型的目的。
进一步可以通过谷歌翻译来验证:
可以看出,英语翻译中使用了过去分词seen,有理由相信,見られる是日语动词的被动形式,按图索骥,查日语动词的被动语态,可以发现以下内容:
动词的被动态及被动助动词「れる·られる」
含有“被…”之意的动词为被动态动词。五段动词未然形后接「れる」、「一段动词、カ变动词、サ变动词」未然形后接「られる」,便构成了被动动词
由此进一步验证了之前的猜想,而此处的に则应该是作为前面的名词“脑机能”和被动动词“见”之间的连接词。
接下来看剩下的内容中的によって,从英语翻译来看,它是一个介词,大致的意思是汉语中的“通过”
因此在日语中,A通过B,很可能是这样的结构:
ABによって
进一步验证,找到以下材料,「~で、によって、を用いて」を表現する前置詞: with と by
因此上述的语句的断点颗粒度可以进一步变大,如下所示:
【脳機能に見られるいくつかの特性】を【計算機上のシミュレーション】<によって>{表現する}【こと】を{目指し}た
其含义浮现:通过计算机模拟来表现在脑机能中所观察到的一些特性。后面的动词目指,应该是表示整个神经网络的目的,而ことを,或者こと,在此处的划分尚不明晰,但已然不影响对整句话的理解。
网友评论