你打开手机淘宝,精美的海报让你目不转睛,你下了单,从快递员手中接过商品,心满意足的那一刻,你不会想到自己在掏钱买下商品的同时也为海报买了单,从模特、摄影到设计师的后期处理,越精美的海报成本越高,当然,你更想不到的是,海报上的每一个字都是要花钱的……
最近,阿里巴巴悄悄推出了全球首个人工智能中文字库,这款阿里汉仪智能黑体测试版,目前拥有3500个中文汉字,将免费提供给阿里用户使用。
服务市场下载页面这既是阿里给电商卖家的春节福利,也是一种新的尝试,阿里希望用技术手段,降低造字成本,让字体市场进入良性发展。而这项技术的受惠者,除了商家、字体公司,当然还包括了消费者。
一套版权费20万的字体
一套正版字体价值不菲。
据悉,天猫上某商家就为一套方正兰亭字体支付了20万元左右的版权费,虽然14款不同字体可以使用5年,但对商家来讲,“要价还是偏高”。
万一有适合广告宣传的收费字体,但前期没有购买版权怎么办?
让设计师对已有的字体进行修改加工,变成新的字体,是一种解决办法。然而一位设计师曾花了半天时间,只设计出6个中文汉字。
“修改设计每个单字不难,把控字体的统一性才是最难的。”该设计师表示,例如“品”“门”“口”这样的字结构过于单一,在修改时反而会增加难度。“有时会发现,组合成的一句话中出现了两种字体,甚至6个字的标题中会出现6种字体,很头疼。”
出于成本考虑,一些商家并不愿意在购买字体版权上花钱,只使用阿里平台上免费商用的华康字体和开源字体。
还有部分商家,则选择使用未经授权的字体,踩中了涉嫌“字体侵权”的雷区。一旦被字体公司起诉,商家除了赔钱,还要撤回已经发布的字体内容,企业的品牌形象和销售业绩都会受到影响。
为什么造字成本这么高
一套字体为何要价万元,字体公司为何四处维权打官司?侵权与维权的背后,不仅仅是利益的撕扯,还有关于创意价值的认可度。
用传统的方法创造一套字体,其实成本很高,因为需要经过创意、选字、确定、拼字、自动分装等一系列漫长的流程。
一套字体通常有两个特点:字型和字量。字型是设计师对字体的“创意”,字库字体讲究整体的搭配协调和美感。
而每套字体的字量通常由市场需求决定。常用的中文简体有6763个中文汉字,包含中文简繁的9169个,用于出版物的大字符集(包含很多生僻字)27533个,包含稀有地名人名用字的超大字符集包含中文7万字以上。
传统字体公司的设计师,可以设计出很独特的单个中文字体,但即便是难度相对低的字型,他们也很难独立完成整套设计。通常是,主创意者创作五六百个字,确定字体的基调后,再由团队其他成员完成剩下的工作。
每一个字都要经过设计师一笔一画地仔细勾勒、调整。通常,设计一套风格字库需要设计1万个左右的字符和标点符号,少则半年、多则好几年才能进入市场。而且,设计出的字体还可能因为不受用户欢迎而宣告失败。
设计成本居高不下,导致正版字体价值不菲,而正版支持者越少,造字成本越高,价格更加降不下来,造字市场就会陷入恶性循环。
怎么用人工智能造字
阿里巴巴每年也要向字体公司支付金额可观的版权费用,就像阿里人机自然交互实验室经常与字体打交道,因为他们的一个研究方向就是设计智能。
“字体相当于设计领域的水电煤。”实验室负责人杨昌源说,“有的字体真的很好看,我们真的很想用,但是太贵了。”
正版字体这么贵,有没有可能让造字成本变低?杨昌源决定带领团队在字体领域做一个新的尝试,用AI生成字体。
“阿里有人才有技术有资源来做这件事情。”杨昌源觉得,造出一款免费字体,对阿里来讲很有价值,既能让商家不再担心版权问题,也能让字体市场变得更加健康。
彼时,实验室正好与阿里PAI团队在其他业务上有所交集,后者主要负责基于阿里云分布式计算引擎的一款机器学习算法平台,“能不能提供技术支持我们做些事?”杨昌源向对方发出了合作邀请。
实验室想要引入新的技术改变现状,PAI团队想要试验新的技术,双方一拍即合,很快达成跨团队合作的意向,他们打算让机器做出一套“跟人做的一模一样的”精美的字体。
此次AI造字,PAI团队的人工智能专家张庆、孙东慧针对字体生成的特定场景将对抗生成网络(GAN)进行了改进。
团队先用天猫字体和淘字体做尝试,但由于两类字体的样本量太少,在手动补充字体样本,用了一两百组算法模型后,设计团队仍认为,字体的精准度不够,还是半成品。
“因为做精准设计的设计师拥有像素级的眼睛,左偏了一个像素都不舒服。” 杨昌源解释道。
两个团队在标准上不能达成一致,AI造字陷入瓶颈。
造一套自带流量的字
调整方向还是就此放弃?杨昌源决定,引入专业的字体公司一起来制定标准。
找字体公司合作并非一帆风顺。“起初谈的时候蛮难的,字体公司的危机感比我们强很多。”杨昌源表示。
很多人惧怕人工智能技术。最初,字体公司担心,自己的生意甚至是整个字体行业会“没了”,更担心阿里这个巨头会不会进入字体这个商业航道。
“字体并不在阿里的主航道上,我们没有野心深度介入字体行业。”杨昌源反复向对方解释,用人工智能造字,是想要尝试将新技术运用到传统的字体领域,“我们不会跟传统行业直接去竞争,我们更多是给大家一个示范,毕竟专业领域的事情还是要靠专业的人去做。”
在合同上来来回回讨论了个把月后,去年12月,汉仪终于与阿里签订了合同,决定双方联手做一套有AI技术成分的字体。双方决定合作的字体是汉仪公司的明星产品,AI造的字体相当于是给这个系列产品做了延伸。
杨昌源说,“签下合同后,我们定下目标:农历年前,一定要出一个版本给大家看,看能到什么程度。
这次合作中,汉仪字库的设计师负责字体的造型设计,阿里的技术团队负责技术,最终通过“喂养”机器,让其自学并生成了一套字库。
阿里汉仪智能黑体字形设计在大数据的帮助下,汉仪字库设计部负责人郑乃玉了解到,一套字体设计出约3500字就能覆盖常用的电商广告用语。
让字体设计师们纠结的是,什么样的字体能帮助电商提升销量。他们希望造出一套“自带流量”的字体,郑乃玉说,“例如,商品广告中‘降价了’这样突出的语言最适合使用现在的字体。”
“不能以人为标准去评判AI字体的好坏。”杨昌源表示,评价字体好坏的标准是,生成的字体跟样本字体有90%以上的神似即可,“至少看上去,它像一套字体。”
2018年1月22日,阿里巴巴终于推出了全球首个人工智能中文字库——阿里汉仪智能黑体,并免费提供给阿里用户使用。
正式版将于4月推出
在这套智能字库测试版本发布当天,景德镇胡图网络科技公司的设计师们在第一时间就下载使用了,设计部的胡经理解释,他们的设计师主要做电商设计的排版,自己根本没有时间设计字体,“现在又有新的选择,还是AI生成的,当然要马上试用一下。”
试用后,胡经理也发现了测试版的一些问题,例如螺蛳粉中的“蛳”、聚会中的“聚”字在被放大后会显得棱角不明,像是没有切割完整。另外,阿里这套字体只适用于醒目的大标题,8号、12号大小的字体就不够清晰且略显粗糙。
胡经理发现测试版中字体的一些问题汉仪字库设计部负责人郑乃玉表示,AI只能生成字体,并不会自己做调整,人机协作是目前的最佳手段,“横平竖直、棱角分明的汉字还是要靠人工干预。”
杨昌源也坦言,测试版本不完美,还在继续优化。2018年4月,“阿里汉仪智能黑体”将推出正式版本,最终字符集可能是6763,未来将用于服务阿里新零售下千万商家及阿里设计生态。
字体机器生成过程人工智能改变字体行业
电商卖家成千上万,消费者喜欢的风格也五花八门,胡经理就发现,女性用户更喜欢秀气的字体,但这套人工智能字库的字体略显粗犷。
对此,杨昌源表示,“阿里在字体领域做尝试是想告诉大家,字体领域是可以有这样一个成果的,进而鼓励大家在有奔头的情况下去做一些尝试。”
“我们想解决的是,当创意很好的时候,怎么加速创意产生到生成的过程。以前设计一套字体需要投入10个人做一年,现在引进新技术,能够节省4-8个月的时间,可以让字体设计人员把注意力更多的放在创意上。” 杨昌源表示。
按照杨昌源的想象,未来,字体行业可能是另一个景象。“字体生态丰富起来,字体的版权也许就不会那么贵了。”
AI造字的过程中,也产生了副产品。“字体检测,我们能够做的很精准了。” 杨昌源透露,现在他们可以检测某字体可能盗用了哪几款正版字体,并提供相应的概率。
在造“阿里汉仪智能黑体”的同时,团队从市面上收集来雍正的毛笔字,临摹出来后给机器学习,机器通过自学仿造出了雍正字体。这项技术无疑将给字体行业、文物及博物馆修复带来一些新的尝试和可能性。
杨昌源开玩笑说,“以后过年,可以让‘雍正赐字’,给电商卖家做些好彩头。”
本文作者:孙茜茜 王安忆
网友评论