跳到主要内容

22 篇博文 含有标签「科技」

查看所有标签

真实信息量

· 阅读需 5 分钟

一段文字、一首曲子、一幅画,真实信息量到底有多少?

从前,除了文件尺寸,我们很难找到别的客观标准来衡量信息量的大小。生成式 AI 的面世揭示了许多数据真实的信息量。比如,记录一个复杂的数学证明可能只需要几 KB 大小的文本文件,却要动用上 T 参数的模型才能正确生成。歌曲音频一般几个 MB,视频动辄几百 MB(非压缩格式的话尺寸更大),但音画生成模型的尺寸相比好的语言模型反而要小很多。如果比较目前开放权重的视频模型和音频模型,两者的规模其实非常接近,远没有它们各自生成的内容(视频和音频)在文件大小上的差距那么大。

目前几大前沿开放模型的尺寸
模型名称类型参数量
ACE-Step音乐🎵3.5B
flux.1 [dev]图像📷12B
Wan2.2视频🎥14B
DeepSeek-R1-0528文字📜685B

这说明,虽然近年来通讯技术一路飞速发展,传输的数据总量呈爆炸式增长,但是这些通讯载体所承载的真实信息量可能没增长得那么快,甚至还有可能在倒退。人类骄傲地宣称「我们身处在一个信息爆炸的时代」,是不是把成千上万 TB 的 Tiktok 视频都算进去了呢?不知道两百年后的历史学家在看到这些视频「史料」的时候,会对我们这个时代作何感想。

外表与内涵的尺寸对比

要生成听起来顺畅的文字,只要 270M 参数就可以了。但是要内在逻辑一致,情感准确丰富,情节跌宕起伏,悬疑环环相扣的文学作品,到现在连 1T+ 的模型也搞不定。可见华丽辞藻的外表相对内在的价值可以说是一文不值。这不是我主观的判断,而是模型尺寸给出的定量结论。

再来看看音乐领域。虽然已经有能够登顶 Spotify 排行榜的音乐生成模型,但为什么没有生成 MIDI (电子乐谱)的模型呢?花里胡哨的媒介(wav)相比朴素的载体(midi),尺寸上要差好几个数量级。但这种尺寸上的增加,非但不会增加实际的信息含量,甚至其作用是偷偷掩盖很多疏漏,把粪土伪装成「黄金」。按业界猜测,生成 Spotify 榜首曲的模型估计只有 10B 左右的参数。想象一下,能生成贝多芬《第五交响曲》第一乐章的模型,估计需要多大呢?如果是 MIDI 这种记录演奏指令而非音频波形的格式的话,只需要 89KB 就搞定了。但是这 89KB 所承载的音乐结构和意图信息量,远远大于几个 MB 的垃圾曲音频文件。

去装饰化

现在许多 AI 编程测评都是「这个新模型做的网页比那个模型更漂亮」。恕我直言,这种测评方式实在是肤浅。且不论「漂亮」的定义随着时代和文化飘忽不定——要不要去关注这个「漂亮」,这本身都变成了一个值得质疑的事情。浮夸华丽的外表,其实暗含了更低的信噪比,干扰了人们对于价值的判断。 在 AI 时代,人们尤其应该学会逆着潮流,努力「去装饰化」,让自己的判断免受华丽载体的干扰:

  1. 在语言生成模型的提示词中加入「用极精炼的语言,给出简洁的结果」。 否则洋洋洒洒、格式华丽的输出会给人一种「肯定很专业、很详尽」的错觉。
  2. 鉴赏艺术作品,先问「作者想表达什么思想?」 甚至先「有罪推论」成 AI 作品,想想提示词可能是什么。
  3. 练习写作、作曲、绘画这几种不同媒介的基本创作能力。 因为有创作经验的人,才能真正有深度地评价别人的创作。

论及礼物的精致,世上怕少有能与日本相提并论的境界。 我曾收到过日本友人的新年礼盒,如电脑屏幕般大小,含蓄而庄重。轻解那细腻如诗的缎带,剥落流转金光的外衣,启开厚实而温润的盒盖,盒中静静安卧两枚小匣,典雅如画,华美如珍宝初现。1

打开一看,两块肥皂。2

Footnotes

  1. 这一段是 AI 写的。

  2. 这句是我写的。

iPad 离婚记

· 阅读需 3 分钟

好几年前,为了废物利用,我费了很大的劲儿在客厅的墙上挖了一个大洞,然后往里面嵌入了一个很旧的第三代 iPad。当时那个 iPad 就已经算过时,即便 24/7 不间断通电到今天已 12 岁高龄,它仍然健康地工作着。

刚安装好的时候,这个 iPad 里装了很多软件,可以放音乐、看电视、控制一些家里的设备,非常实用。

但我之后犯了一个重大的错误——把 iPadOS 升级到了 9.0。升级一完成,我就发现这个 iPad 几乎就无法动弹了,之前的 App 启动时间都变得巨长,好几个 App 直接因为旧版本不兼容不能工作。我尝试把整个设备全部抹除重装,可是连全新的系统都慢到根本无法使用。

现在,这个 iPad 只能作为一个计时器忠心耿耿地工作着。当初如果不升级,哪怕 App 们已经停更作废,只要浏览器能正常工作,总能想办法让它继续发光发热下去。

当年的 Apple 设备,质量上真是过硬。所以 Apple 只能靠软件下阴招,强行淘汰明明好用的设备,以至玩火过头,闹出了之后的 iPhone 电池门事件

最近这几年我又买了两台 iPad,基本寿命都没过两年。第一台现在还在勉强用着,但电源键按下去就会卡住,要用指甲抠出来。第二台没用多久,充电口突然罢工。这两台拿到 Apple 店里去修,结果工作人员连看都没看,就说 Genius Bar 是完全不管 iPad 的。除非有 Apple Care,否则一律不管不修,连基本的故障排除也不给做。

勉强用着的那台,最近更新了一下系统,存储空间一下子变得超级满。想要删文件非常困难,更不用说要把数据备份到自己的电脑有多困难了。

很显然,最白痴的不就是我吗?这么烂的产品,为什么接二连三地买?

  • 因为孩子的老师只会用 iPad 对接传输文件
  • 因为孩子的老师只会用某个 App 上网课,但这个 App 没有 Android 版(更别说网页版了)
  • 因为在 Apple App Store 买了几个游戏
  • 因为可以跟我老婆的 iPhone 互连
  • 因为……

想不出其他理由了,不就这么点优势嘛?前几天趁着 Google Pixel Tablet 清仓促销,入手了一台,刷成了 GrapheneOS。今后哪个老师要不会给 Android 传文件,不会用 Android App 上网课,就别当我孩子老师了🤗