跳到主要内容

如何估算「隐私」的卖价

· 阅读需 3 分钟

今天有点好奇:一个普通用户的隐私具体被卖了多少钱?我搜集了一圈数据,发现还是能算出一个数来的。

下面以 Facebook 为例。根据 Meta 在 2023 Q4 财报1中披露的信息,当年的平均用户收入2是 $44.60。平均每个用户的在线时间是 10 分 22 秒3。也就是说,如果你平均每天在 Facebook 上花一个小时,那么你一年为 Facebook 创造的营收大约是 $258.14。

这个数字全算成「隐私的价格」有点不公平,因为哪怕 Facebook 完全不用你的个人信息,随机给你投放广告,你也有一定的概率点进去的。但是现实中不存在这么善良的 Facebook 啊~🤔

所以我们只能用一些其他的数据来估算,比如这份报告4给出了广告在不同投放渠道的里「点击率」5。其中:

有无个人信息的对比点击率效果
个人定制的「畅销推荐」相比无定制的「畅销推荐」×2
再营销广告(之前访问过网站但还没消费)相比一般广告×10
个人定制的「行动呼吁」相比泛泛的「行动呼吁」×3
「行动呼吁」

行动呼吁(Call-To-Action, CTA)是营销学里的术语,指「立刻购买!」「手慢无!」之类的催促性广告。

可见,隐私信息对于广告商业转化率的效果是巨大的。如果保守估计因为收集个人信息,广告供应商平均可以提升 30% 的点击率,那么每年一小时给 Facebook 贡献的 $258.14 里,基础部分是 $198.57,隐私部分是 $59.57($198.57 的 30%)。(这个提升的比例猜得越高,隐私部分的比例也越高。)

因此根据我的粗略估算,你平均每天多上 1 分钟 Facebook,一年下来 Meta 能从你身上大约多榨取 $4 价值,其中约 $1 来自你的隐私,$3 来自你的注意力本身。

解释
  • 这是 Meta 目前在你身上能榨取出来的价值,并不是你隐私的真正价值。目前你的隐私的商业价值还没被完全开发,很可能被贱卖了。也可能因为法律法规的原因,Meta 无法最大化利用你的隐私(比如直接敲诈勒索);如果你的隐私泄漏给了违法分子,那么你的损失也许会不可估量。
  • 这是全球所有用户的平均估值。如果你在网上消费多,或者容易受广告的影响,那么你的隐私单价就会大大高于这个平均值;如果你穷,那么恭喜你,你的隐私就不怎么值钱(从 Meta 的角度看)。
  • 这个平均估值可以用在别的有广告的平台上(Google、Apps,甚至你的 Windows 10/11)。

Footnotes

  1. https://d18rn0p25nwr6d.cloudfront.net/CIK-0001326801/c7318154-f6ae-4866-89fa-f0c589f2ee3d.pdf

  2. Average Revenue Per User (ARPU),财报第 70 页。这是全球的平均,具体到高收入地区,这个数字还要高。例如美国的平均可以达到 $68.44。

  3. https://www.demandsage.com/facebook-statistics/

  4. https://bestcolorfulsocks.com/blogs/news/product-personalization-engine-ctr-statistics

  5. Click-Through Rate (CTR) 指的是「广告被点击次数 / 广告被显示次数」,这是广告最重要的商业价值指标。

App 升级

· 阅读需 1 分钟
  • iOS 升级后界面变得好漂亮哦,但导致旧的 iPad 慢到完全不能用,只能报废;
  • Plex 升级后界面变得好漂亮哦,但找不到自己的服务器了,只能降级;
  • Marriott 升级后界面变得好漂亮哦,但无法在 GrapheneOS 上打开,因为通不过 unrooted 检查(这个真是脑子有病吗?我的银行 App 全都不查 root,一个订旅馆的 App 激动啥?而且我根本没有 root 我的手机啊!);
  • Bitwarden 升级后界面变得好漂亮哦,但很多网站自动填写会失败

今天,微信升级后导致聊天里的图片和所有公众号都打不开了,时不时闪退。这次升级终于改善了我的生活品质。

结论

  1. 能不更新的 App 就不要更新。毕竟 GrapheneOS(甚至普通 Android) 的安全性足够好,App 极少会有什么影响整个手机安全的重要漏洞;
  2. 如果 App 的界面突然变得很漂亮,功能大概率要出问题😑

我对肖七「侵略主题」的理解

· 阅读需 6 分钟

偶尔翻到我在 2024 年 5 月 3 日写下的一小段迷你日记:

今天上班路上听着肖斯塔科维奇的第七交响曲,结果猝不及防地被侵略主题的黑暗震撼到一个人在车里失声痛哭。

终于认识到,​有些古典乐真的很不适合小孩子。那种黑暗和阴影,可以摧残人的心灵。

我觉得即使自己的理解并不一定「正确」、「权威」,至少它直击到了我的灵魂,所以我决定还是把我的所思所想记录下来。

「侵略」主题

肖斯塔科维奇是「二十世纪古典音乐史上最重要的作曲家之一」。他大半辈子都活在「伟大的慈父」斯大林的掌权时期。

肖斯塔科维奇一生离奇的高产,居然写出了十五部交响曲(其他音乐家早就死了1)。其中标题为《列宁格勒》的第七交响曲,写于 1941 年二战期间,描绘了惨烈的列宁格勒保卫战。第二年,他就靠这部作品拿到了斯大林奖一等奖。

第一次听肖七之前,我读到不少关于第一乐章中那段著名「侵略主题」的介绍。大致就像维基百科(繁体版)写的:

這段(指「侵略」主题)是由小鼓重覆奏出兩小節長的節奏所主導,在整個發展部中,小鼓的節奏從沒有停頓過(全個段落小鼓手共奏這節奏動機超過一百次),這個小鼓節奏代表了對列寧格勒步步進逼的德國軍隊。各樂器分別奏出一段長二十小節的重覆旋律樂段(另外两小節小鼓過場),並且加入不同的演奏手法,例如第一次只是長笛的獨奏;第二次則是長笛和單簧管的呼應;及後又有主調伴奏,銅管樂模仿空襲警號等等,重覆旋律樂段共有十二次,而最後一次重覆,銅管的最強奏中帶到再演部……

疑惑

但是当我真正听到这段主题2响起的时候,我的第一反应却是:「这哪里像『步步进逼的德国军队』啊?」

(这是「侵略」主题第二遍重复。我调大了 24 分贝,原曲这里还是极弱,几乎听不见。)

大调音阶,轻快明亮,一开始简直人畜无害、天真无邪。哪个作曲家会用这种调子写敌军?就算是从远处走来,也不至于这么正气凛然吧?

真要描写邪恶侵略,难道不应该是这样?

(其实这段文革抗战电影《平原游击队》里的插曲《鬼子进村》就是改编自肖七「侵略」主题)

发展

主题第三遍重复依然很轻,但低声部明显不协和,让阳光轻盈的旋律底下透着一丝不对劲。

接着,肖斯塔科维奇突然改变了重复格式。这么刻意的设计,作曲家一定是想要表达什么吧。

(很奇怪,双簧管和低音管突然开始一唱一和起来。这跟侵略有什么关系?)

音乐继续推进,那段轻快的旋律从单线条逐渐扩张成卡农堆叠,不经意间刺耳的高低声部开始滋生。一种潜移默化的邪恶悄悄长大、盘根错节地缠上来,等到主题转至阴暗的小调,张牙舞爪露出真面目时,一切已经晚了。我仿佛看到恐怖片里的小丑面具——狰狞又荒诞,恐惧瞬间炸开。

(未对音量作调整。虽然一开始很轻,但是最后音量会拉满!跳转的话要注意~)

尤其是侵略主题接到下一个段落的那个音阶(上面片段 7:09 处),最后一个强音落在了极度黑暗的减和弦。其实这个音符早被之前的进行暗示了,可当它真正响起时,我还是被那种猝不及防的绝望击穿。

理解

这个一开始天真无邪、光辉正义,最后把人压迫到窒息的是什么邪恶力量呢?在肖斯塔科维奇的年代,只有一种可能……那就是斯大林的独裁

尤其是第四遍重复:童谣般的简单旋律,被双簧管和低音管一唱一跟,乍听像是小孩学语。仔细想想,这不就是有独裁倾向的政权在试探着做服从性测试3吗?

正因为人们的忽视、纵容与服从,独裁的势力才不断蔓延、壮大,直到扎入骨髓,长出绝望。我之所以觉得结局如此黑暗,并不是因为人们抵抗暴政失败。

恰恰相反:

人民才是一开始助长独裁火苗的薪柴。

肖斯塔科维奇真的是一个旷世奇才。如果我猜得不离谱的话4,他在接过斯大林奖奖状的那一刻,心里应该爽翻天了吧!

It's me!

Footnotes

  1. 因为第九交响曲魔咒

  2. 这里用的是伯恩斯坦指挥、芝加哥交响乐团演奏的版本: https://youtu.be/hR37aTd8mMM

  3. 参见臭名昭著(但意义深远)的米尔格伦权力服从实验

  4. 一开始我还挺怕自己过度解读到肖斯塔科维奇的棺材板都要压不住了。不过后来发现我的确没有过度解读😅

小山顶

· 阅读需 1 分钟

十月了,天气居然还能在二十七八度的样子。趁着天还暖和,我带着两个娃去附近的小山顶吹吹风。

overlook (一望无垠的美国郊区)

butterfly (漂亮的小蝴蝶紧紧抓着花。山顶风很大,这么轻的蝴蝶,这么大的翅膀,不被吹走感觉很神奇。)

shadow (山顶的保留项目——超长影子秀😁)

这个半大不小的小山头,其实原本是个垃圾掩埋场。站在堆得这么高的垃圾上,我突发奇想:

如果大家努力制造更多的垃圾,就堆出更多山头,那样就不用害怕全球变暖导致的海平面升高了呀~💯

before:

· 阅读需 3 分钟

不久的将来,before: 就要变成使用 YouTube 的必备了。

这是什么东西?

这是在 YouTube 上搜索视频时可以使用的特殊关键词,规定视频的创建日期必须要早于给定的年份或日期。

在 YouTube 搜寻视频的时候,如果直接打开「搜索条件」,你会发现 YouTube 只允许你指定搜索结果要有多新。

(只能选最近一周、一个月、一年,甚至还有今天、最近一小时)

生气!为什么没有「最近一分钟」?🤬这叫我们怎么赶上最时髦的潮流?!

你猜到了——如果想搜索 2015 年前的视频,可以在搜索词后面加入 before:2015 就可以了。除了年份之外,具体到某个日期也是可以的。

early Youtube videos (「最近一天」好无趣,「最远一天」才好玩!)

求生技能

前几天 Sora 2 上线了,在社交媒体上大有排山倒海之势。人们纷纷丢弃真人版的 Tiktok,转投 AI 的怀抱。魔法打败魔法,当戏看也挺爽的。

接下来想要继续正常使用 YouTube 的话,记得在所有的搜索词后加上 before:2025(或者更早也可以)。

细节

after: 这个关键词也是存在的,可以和 before: 搭配使用限定日期范围。after: 后面的日期是包含在结果里的,而 before: 后面的日期不会被包含。

我猜这是因为程序把时间设定在了当天的 0:00。

附:一些奇怪的宝藏

我用这招找到了一些奇奇怪怪的好东西。

搜索 AI generated before:2013,之后偶然看见了这个视频探讨什么是「意识」:

(视频 1:33 处说:「什么是『意识』不好定义,但什么不是『意识』我们都有共识。比如,Cleverbot(一个聊天机器人)就不是意识……」13 年前还能达成的共识,今天反而不能达成了。)

搜索 apple commercial before:2006,我看见了这个广告:

(Apple 标榜自己为解放思想的先锋,打破像小说《1984》里那样的洗脑……四十年后颇有讽刺意味)

搜索 dance before:2006,找到这个视频:

(欸?这个我大学的时候看过啊!神人~他的 Youtube 频道

搜索 artificial intelligence before:2006,找到这个萌宠的机器人:

(这个个头和颜值,加上现在的 AI 脑子,如果还能离线运作的话,那我肯定买了)

有时候不好用

有些关键词被鸡贼的 YouTube 挟持,即便加了 before:,查询结果里依然会加入大量的最新视频。如果出现这种情况,把古董视频找出来就要费很大的力气。

避免使用一些过于笼统的关键词,例如 technologynewsstock market……

黑胶唱片、旧书、苹果广告

· 阅读需 7 分钟

上个周六,我们在一个看着有点破旧的芝加哥街区找了一家四川菜馆。吃完饭,女儿突然提议去街角的黑胶唱片店转转,她要买唱片。呃……可是我们家连黑胶唱片机都没有,买唱片来能干嘛?不过拗不过女儿的再三坚持,为了饭后消消食,那就去转转吧。

黑胶唱片

推开店门,店里整齐地摆满了一盒盒的唱片,盒子上贴着非常细致的分类标签。作为一家唱片店,店里却没有播放背景音乐,老板则坐在一侧的柜台后面看着书,没有推销。安安静静的环境,给顾客一种被尊重的感觉。

唱片店

用手翻动装在盒子里的黑胶唱片,试图找到自己感兴趣的音乐的时候,我心里突然有一种庆幸,自己居然还能接触到这样的实体胶片。

我对许多的乐曲分类还没概念,尤其是电子舞曲的派别门类甚是繁多。以前觉得这么多分类形式大于意义。直到来唱片店才意识到,没有细分就很难找到某个专辑啊!唱片店可不像 Spotify 算法推荐,一直闭着眼听下去就好了。唱片是要去用手一张一张找的。很不方便,但是很有感觉!

细致的分类

我有收藏 CD 的习惯——不过处于模拟与数码的夹层中的 CD,接下来的命运可能连黑胶唱片都不如。看样子要考虑把收藏的对象改成黑胶唱片了?而且黑胶唱片拿在手里的时候,的确会给人一种比 CD 更亲切的感觉。因为 CD 上记载的是需要解码的 0 和 1,但黑胶唱片上刻着的是真正的声波。模拟与数字,两者的「温度」明显不同。

旧书

从黑胶唱片店出来,女儿还坚持要去隔一条街的旧书店。我在心里预演了我们是唯一的客人,又买不到什么有用的书的尴尬感。推门而入才发现,其实客人还真不少,许多人拿着书静静地站着看。女儿转了几圈,找到了一本介绍鸟类的插画集。厚厚一本书里,每一页都画着十几种不同鸟的插画和详细的介绍,微微泛黄的书页让人反而有一种想要细细品读的冲动。

鸟类插画书 (精致而严谨的插画,有着照片和 AI 无法代替的美)

她又找到了一本 Walt Whitman 的诗集。结账的时候,店主亲切地给她介绍了诗人 Emily Dickinson。

我和老婆在离开的时候,忍不住画蛇添足地加了一句:「We will be back!」

旧书店

新书书店和图书馆,我们是经常去的。但是旧书店的气氛完全不同。新书书店,每一本书都有好多册,卖完了还可以进货,可以网购。图书馆里的书,不会给人珍惜的感觉。借出去的书,迟早会还会来。旧书店里的大多数书都只有一册,错过的书很可能是古早的珍藏版,没了也许就再也找不到了。

但是书并不是真正的主角——只有热爱读书的,才会选择开旧书店。

苹果广告

黑胶唱片和旧书,让我不由联想到去年引发不小争议的苹果 iPad 的广告。单就表现力和创意而言,这部广告还是很不错的艺术作品,值得一看。

(看了有什么感受?)

液压机粉碎了实体的一切,其中就包含了黑胶唱片和书。当一只不知是男女是的手举起新款 iPad 的时候,音乐播放最后的一句歌词:

🎵 All I ever need is you~

呃……广告不再需要人脸,游戏不再需要手柄,画画不再需要颜料,肖邦不再需要钢琴,连平时拿在手里捏捏的舒压娃娃都逃脱不了眼珠子被挤爆的宿命。对我而言,这则广告无疑是在宣誓一种主权:不需要你的同意,科技就可以强行闯入你的世界,摧毁你所珍爱的一切,完了掏出一个圆角长方形的设备说:「这个可以代替它们啦~不用就落伍啦!」

我很难想象,「All I ever need is you」这句话会出自一个人的心扉。它更像是苹果拿着枪顶着我们的脑袋,让我们撤销对它的强奸起诉。

其实,只要作一个非常小的改动,这个广告应该就能成为一则值得载入史册的经典:

(牺牲一个 iPad 就能换回这么多美好的东西!)

只可惜如今的硅谷巨头们,一个个自命非凡,或明或暗地给自己披上了人类救世主的锦袍。它们早已丧失了辅佐人性光辉的能力,成为了剥夺人类自由的新恶龙。但同时也有越来越多的人,心甘情愿地躺平在这堆昔日的物件之下,一同被压进了由巨头们掌控的二维世界里。

距离

「All I ever need is you」这句话还含着一个更深层的谎言。表面看起来,实物功能的确都被这一个小小的电子设备实现了,但其实像读书、听音乐之类绝大多数的功能只是被云端化、平台化了。这些数字设备,把人与人的连结,替换成了人与平台的连结。

  • 开发软件的去 App Store,买软件的去 App Store
  • 买书去 Amazon、卖书去 Amazon
  • 开车的找 Uber,打车的找 Uber
  • 做音乐的去 Spotify,听音乐的去 Spotify

这种平台化的连结,拉近了人与人的距离吗?不要忘了,几乎所有的平台都有政策条款或者技术手段,严格限制买卖双方绕开平台直接对接。平台把全世界的人都拉到了它自己的身边这点不假,可是它本身却在人与人之间刻意制造无穷大的隔阂。也就是说,只有商品的流通距离被缩短了,人与人的距离其实是增加了。平台成为一个滤网,让金钱和资本通过,却把人当作渣滓一样筛滤出来。

所以最新的 iPad 广告,不再需要出现那种亲朋好友其乐融融共享设备的快乐画面,人像 Matrix 电影里预言的那样,只要接入母体,就能拥有一切:

「All I ever need is you」

这么多年,我从来没有进到过黑胶唱片店、旧书店,也没有少用过电子设备来替代这些实物的存在。现在想来,值得愧疚,错过太多。在这些实体小店倒闭之前,多去逛逛,多跟店主互动,留下一些感动,建立一些连结。当然更希望这些人文的温度能保留下来,在越来越数字化的世界里占住一席之地。再厉害的液压机也会有压不扁的东西、压不垮的人。

「We will be back!」

为什么全球大多数股市的全部收益都在盘后

· 阅读需 7 分钟

假设用以下两种策略来投资美国股市:

  • 「蓝策略」每天在纽约时间 16:00 用收盘价买入美股 ETF,第二天早上 9:30 一开盘就卖出,等到下午收盘前再次买入。如此周而复始。
  • 「绿策略」相反,每天一开盘买入,收盘时卖出。如此周而复始。

根据一个专门关注「异常隔夜回报」的网站1,这两种策略从 1994 年来的总收益(不计交易成本),大概会长得像这样子:

S&P500 ETF (SPY) 的收益曲线

为什么白天持股和晚上持股的收益差距能这么大?我能想到几个正常的理由。

正常理由一:资金利用率没有最大化

先考虑一些显然的因素。首先就是要确保这两个策略没有在浪费资金——在投资里,任何闲置的资金至少要能获得一个「无风险利率」的收益;换言之,不用的钱必须要存银行吃利息(这是理论上的假设,实际生活中当然有不存银行的理由啦)。

什么是无风险利率?

无风险利率(英语:risk-free interest rate),或称零风险利率,是指一项没有金融风险的投资可得到的理论投资报酬率。

一般满足无风险定义的资产包括超短期(隔夜)的贷款利率、有信用和货币主权的国家(例如美国)的短期国债等等(几乎就是包赚不赔的投资)。

于是,我们要先修正一下这两个策略,让两者没有「浪费」。这样才能公平比较它们的回报差别:

「蓝策略+」是:白天钱存银行,晚上投股票 「绿策略+」是:白天投股票,晚上钱存银行

由于利息是隔夜计算的,「绿策略+ 」能拿到银行利息,「蓝策略+」一分利息都拿不到。因此如果都不存银行的话,「蓝策略」等价于「蓝策略+」,但「绿策略」相比「绿策略+」要损失一个无风险利率。

除非我们在白天能找到无风险的投资渠道,否则绿相比蓝一定是吃亏的。而无风险利率是由各国的中央银行调控的,长期无风险利率收益应该约等于通货膨胀率(因为根据传统的金融理论,不愿意承担风险就得不到超额收益,存银行拿来的利息,和物价上涨的幅度也应该正好抵消)。

那么 1994 年到 2005 年的通货膨胀率是多少呢?我在这里算出来的数是 +118.61%。所以「蓝策略+」收益是如图中的 +1,528%,「绿策略+」收益是 +118.61%,两者还有很大的差距。

正常理由二:盘后比开盘的时间长、风险大

这是另一个显然的因素。按照纽交所开盘的时间来计算,股票一年的开盘交易时长大概是 250 天,每天交易 6.5 个小时,一年总共交易的时长是 1600 小时左右。盘后的时间约为 7100 小时以上。盘后又是各个公司财报发布的时间(几乎没有公司会在开盘的时候发表财报这样的重要公告)。因此,「蓝策略」持股的时间和承担的风险都远远大于「绿策略」,回报当然也理应高得多。

接下来,就是非正常理由了。

正常理由无法解释的全球股市

我的标题用了「全球股市」,但是到目前为止,我只是在说美国股市。那么全球其他股市到底有没有类似的情况呢?在此借用 overnightreturns.org 的图表:

全球市场 仅盘中 vs 仅盘后 策略收益

这就相当离谱了!绝大多数的股市如果按照「绿策略」,基本要把全部的本金亏掉?!这是怎么回事?即使按照上面分析的理由,夜间持股的时间比白天长,那两者至少还是同涨同跌才对。何况夜间持股在分红的时候价格上还吃亏了(分红日价格会隔夜下降,因为要把分红的部分从价格里扣掉)。

我绞尽脑汁想,只能推测出一个理由——信息泄漏

什么信息泄漏

无疑,如此长期的反常趋势,只能推导出下面两个陈述,至少有一个是真的:

  1. 开盘价高于公允价
  2. 收盘价低于公允价

只有这样,「绿策略」才有可能反复高买低卖,持续亏损。「收盘价低于公允价」,可以看作是上述「正常理由二」的一个印证(市场害怕晚上无法交易的时段爆出黑天鹅事件)。但是像泰国和台湾这样的股市,几十年来两者的趋势对比居然毫无波动,很难想象能用「风险规避」这样的理由来解释。这样,我们只能聚焦在「开盘价高于公允价」这个假设了。

谁会在开盘价买入股票呢?就是在收盘后下单买股票的人。这些单子不能交易,就会被暂存在券商,等待开盘后发送到交易所成交。那么这些券商如何利用这些单子的信息呢?

有一点是肯定的——券商们一定非常诚实,绝对不可能将订单信息卖给别人,也不可能自行哄抬价格让客户吃亏的啦! 客户亏钱肯定是自己运气太差——不是一般的差,是三十年来持续差得离谱。👻

图里还会看到一个现象:美国的 S&P 500 走势明显要好于其他的市场。 我猜测的理由是:S&P 500 指数有流动性非常高的夜间期货市场。

市场流动性

市场流通性市場流動性通常简称流通性流动性(英語:liquidity),即个人或公司可以快速购买或出售一项资产,而不引起该资产价格的急剧变化。

简言之,市场上同时有很多的买家卖家,所以想买的人和想卖的人都能快速以合理的价格达成交易。

期货市场的特点就是买卖对称(或者应该说是做多和做空)。技术细节不在此赘述,总之如果有人发现价格异常,就可以快速通过期货来套利,而不会像股票一样一个晚上都无法交易。

结语

这些观察完全不是用来推销「收盘买,开盘卖」的策略的——如果天天这样捣腾,投资很快就都被手续费和交易成本侵蚀完了。

我只是想指出,夜间无法交易,使得有机会泄露信息的券商可能获得丰厚的不公平收益。对抗这些不公平手段的方法,就是引入更健全自由的交易机制(24 小时期货交易、现货交易),让市场监督市场,用魔法打败魔法。

对于个人投资客并没有什么能学到的功课。如果你不是一直买进卖出(绝不应该这样做),那么偶尔买入卖出的时间点,并不会对长期投资的收益有什么实质影响。当然,尽量不要在盘后下单啦,尽自己一份力让作弊者少挣一点~

Footnotes

  1. https://www.overnightreturns.org

真实信息量

· 阅读需 5 分钟

一段文字、一首曲子、一幅画,真实信息量到底有多少?

从前,除了文件尺寸,我们很难找到别的客观标准来衡量信息量的大小。生成式 AI 的面世揭示了许多数据真实的信息量。比如,记录一个复杂的数学证明可能只需要几 KB 大小的文本文件,却要动用上 T 参数的模型才能正确生成。歌曲音频一般几个 MB,视频动辄几百 MB(非压缩格式的话尺寸更大),但音画生成模型的尺寸相比好的语言模型反而要小很多。如果比较目前开放权重的视频模型和音频模型,两者的规模其实非常接近,远没有它们各自生成的内容(视频和音频)在文件大小上的差距那么大。

目前几大前沿开放模型的尺寸
模型名称类型参数量
ACE-Step音乐🎵3.5B
flux.1 [dev]图像📷12B
Wan2.2视频🎥14B
DeepSeek-R1-0528文字📜685B

这说明,虽然近年来通讯技术一路飞速发展,传输的数据总量呈爆炸式增长,但是这些通讯载体所承载的真实信息量可能没增长得那么快,甚至还有可能在倒退。人类骄傲地宣称「我们身处在一个信息爆炸的时代」,是不是把成千上万 TB 的 Tiktok 视频都算进去了呢?不知道两百年后的历史学家在看到这些视频「史料」的时候,会对我们这个时代作何感想。

外表与内涵的尺寸对比

要生成听起来顺畅的文字,只要 270M 参数就可以了。但是要内在逻辑一致,情感准确丰富,情节跌宕起伏,悬疑环环相扣的文学作品,到现在连 1T+ 的模型也搞不定。可见华丽辞藻的外表相对内在的价值可以说是一文不值。这不是我主观的判断,而是模型尺寸给出的定量结论。

再来看看音乐领域。虽然已经有能够登顶 Spotify 排行榜的音乐生成模型,但为什么没有生成 MIDI (电子乐谱)的模型呢?花里胡哨的媒介(wav)相比朴素的载体(midi),尺寸上要差好几个数量级。但这种尺寸上的增加,非但不会增加实际的信息含量,甚至其作用是偷偷掩盖很多疏漏,把粪土伪装成「黄金」。按业界猜测,生成 Spotify 榜首曲的模型估计只有 10B 左右的参数。想象一下,能生成贝多芬《第五交响曲》第一乐章的模型,估计需要多大呢?如果是 MIDI 这种记录演奏指令而非音频波形的格式的话,只需要 89KB 就搞定了。但是这 89KB 所承载的音乐结构和意图信息量,远远大于几个 MB 的垃圾曲音频文件。

去装饰化

现在许多 AI 编程测评都是「这个新模型做的网页比那个模型更漂亮」。恕我直言,这种测评方式实在是肤浅。且不论「漂亮」的定义随着时代和文化飘忽不定——要不要去关注这个「漂亮」,这本身都变成了一个值得质疑的事情。浮夸华丽的外表,其实暗含了更低的信噪比,干扰了人们对于价值的判断。 在 AI 时代,人们尤其应该学会逆着潮流,努力「去装饰化」,让自己的判断免受华丽载体的干扰:

  1. 在语言生成模型的提示词中加入「用极精炼的语言,给出简洁的结果」。 否则洋洋洒洒、格式华丽的输出会给人一种「肯定很专业、很详尽」的错觉。
  2. 鉴赏艺术作品,先问「作者想表达什么思想?」 甚至先「有罪推论」成 AI 作品,想想提示词可能是什么。
  3. 练习写作、作曲、绘画这几种不同媒介的基本创作能力。 因为有创作经验的人,才能真正有深度地评价别人的创作。

论及礼物的精致,世上怕少有能与日本相提并论的境界。 我曾收到过日本友人的新年礼盒,如电脑屏幕般大小,含蓄而庄重。轻解那细腻如诗的缎带,剥落流转金光的外衣,启开厚实而温润的盒盖,盒中静静安卧两枚小匣,典雅如画,华美如珍宝初现。1

打开一看,两块肥皂。2

Footnotes

  1. 这一段是 AI 写的。

  2. 这句是我写的。

没电,感恩

· 阅读需 3 分钟

今天起床了才发现,手机一晚上没充上电。

手机因为电量耗尽而关机之后,给它充电就特别费劲。如果插上一个低功率的充电器,手机马上就会强制自动开机(取消不了!),然后在启动过程的不知道哪一步中耗费大量的电量,超过充电器能提供的功率,于是手机电量再次耗尽,被迫重启(而不是关机!),这样死循环了一晚上。

解决方法是放在无线充电器上,那样手机被充电的时候不会自动开机(原理不明)。只要充到电量能坚持完整个启动过程,换成普通的充电器也没问题了。

因为时间不够,我只能带着一支电量苟延残喘的黑屏手机匆匆去上班。

外面天气还不错,有点早秋的凉爽。太阳被云层遮盖,照耀出一层金边。每天开车上下班的路上有一片普普通通的绿田,不知道种的是什么,也从来没去关心过。今天驶过,映入眼帘是一番奇幻的风景——只有那片绿地被一层浓浓的雾气笼罩,宛如仙境一般。开车来回经过这里十几年了,这样的美景是第一次见到!我下意识拿起手机……

没电!

十几年一遇的奇景,遇上了几年一遇的手机一大早就没电。每当这种概率几乎为零的事件发生的时候,我就知道这大概率是上帝的引领——

「拍照真的很重要吗?拍下来的照片,除了能勾起我自己的回忆,还有什么意义吗?这种田野上升腾着雾气的照片,网上不是一大堆吗?AI 不能生成吗?别人就算看了,能享受和我一样的感动吗?」

所以,我其实什么都没有错过;相反,这次我用双眼收获了久违的感动。

倘若李白不是用笔墨留下「疑似银河落九天」这样壮阔的诗句,而只是掏出手机拍下了「庐山瀑布001.jpg」,民族文化都会因此缺了一个角。

为与千年以后说中文的人共享今天这份小小的感动,我与 DeepSeek V3.1 共事半小时,作下小诗一首:

翠野凝烟晓色寒
疑有夜仙宿未还
殊景偏逢电量尽
恍悟真境胜矽盘

多亏今早手机没电,感恩。

iPad 离婚记

· 阅读需 3 分钟

好几年前,为了废物利用,我费了很大的劲儿在客厅的墙上挖了一个大洞,然后往里面嵌入了一个很旧的第三代 iPad。当时那个 iPad 就已经算过时,即便 24/7 不间断通电到今天已 12 岁高龄,它仍然健康地工作着。

刚安装好的时候,这个 iPad 里装了很多软件,可以放音乐、看电视、控制一些家里的设备,非常实用。

但我之后犯了一个重大的错误——把 iPadOS 升级到了 9.0。升级一完成,我就发现这个 iPad 几乎就无法动弹了,之前的 App 启动时间都变得巨长,好几个 App 直接因为旧版本不兼容不能工作。我尝试把整个设备全部抹除重装,可是连全新的系统都慢到根本无法使用。

现在,这个 iPad 只能作为一个计时器忠心耿耿地工作着。当初如果不升级,哪怕 App 们已经停更作废,只要浏览器能正常工作,总能想办法让它继续发光发热下去。

当年的 Apple 设备,质量上真是过硬。所以 Apple 只能靠软件下阴招,强行淘汰明明好用的设备,以至玩火过头,闹出了之后的 iPhone 电池门事件

最近这几年我又买了两台 iPad,基本寿命都没过两年。第一台现在还在勉强用着,但电源键按下去就会卡住,要用指甲抠出来。第二台没用多久,充电口突然罢工。这两台拿到 Apple 店里去修,结果工作人员连看都没看,就说 Genius Bar 是完全不管 iPad 的。除非有 Apple Care,否则一律不管不修,连基本的故障排除也不给做。

勉强用着的那台,最近更新了一下系统,存储空间一下子变得超级满。想要删文件非常困难,更不用说要把数据备份到自己的电脑有多困难了。

很显然,最白痴的不就是我吗?这么烂的产品,为什么接二连三地买?

  • 因为孩子的老师只会用 iPad 对接传输文件
  • 因为孩子的老师只会用某个 App 上网课,但这个 App 没有 Android 版(更别说网页版了)
  • 因为在 Apple App Store 买了几个游戏
  • 因为可以跟我老婆的 iPhone 互连
  • 因为……

想不出其他理由了,不就这么点优势嘛?前几天趁着 Google Pixel Tablet 清仓促销,入手了一台,刷成了 GrapheneOS。今后哪个老师要不会给 Android 传文件,不会用 Android App 上网课,就别当我孩子老师了🤗