Global village🌏Global village🌏·

造福无数打工人,世界第7大网站,为什么过得如此卑微?

投稿時間:2024-08-27 19:18:58閲覧数:29
一般記事
転載は出所を明記してください

维基百科(Wikipedia)是世界十大访问量最大的网站之一(Similarweb上排名第七),它拥有6300多万篇文章,每个月有15亿次独立访问。

当无数打工人通过Google搜索资料时,它经常出现在第一位。

流量这么大的网站,稍微动动手指,收点儿广告费,应该过得非常滋润吧?

不,维基百科几乎每年都会请求用户捐款,用词非常卑微:

“只要你捐2.75美元......Wikipedia就可以持续繁荣多年,我们恳请你,不要滑走.....

“如果你能捐2欧元,只是一杯咖啡的钱......

这一切是怎么发生的呢?

1

1999年,正是互联网野蛮生长的早期时代,无数的点子开始在互联网上涌现。从小就喜欢百科全书的吉米·威尔士决定建立一个在线的百科全书:Nupedia

他的想法非常美好,互联网时代,分布在全球各地的志愿者们都可以参与百科全书的撰写。

但是如何保证文章的质量呢?

吉米·威尔士决定引入同行评审,建立多个同行评审委员会,制定了严格的审批流程,对志愿者写的文章进行审核,反馈。

但是这种制度被证明行不通,Nupedia建立的第一年,只发布了21篇文章。

很多人觉得,在Nupedia写文章就像研究生提交论文,流程让人望而生畏。

吉米·威尔士曾经写了一篇关于诺贝尔经济学奖获得者的文章,他自己都不敢将初稿提交给同行评审的著名金融学教授,从那一刻开始,他意识到Nupedia的模式是个死胡同。

但是不审核的话,又很容易产生垃圾文章,在线的百科全书更不可能建立起来了。

吉米·威尔士陷入了一个死循环。

2001年1月,Nupedia的主编拉里·桑格从朋友那里得知了Wiki的概念,Wiki是一种基于Web的协作工具,它允许多个用户在同一个文档上进行协作编辑。

换句话说,你可以修改我写的东西,你也可以修改我写的东西。

当然,Wiki提供了版本历史的功能,这样一旦出现错误,或者有人故意搞破坏,就可以轻松回退到之前的版本。

那能不能也采用这种模式,放开让大家写百科全书呢?

但是,没有审核,开放编辑,这样能行吗?

吉米·威尔士和拉里·桑格心里也没底,于是他们在保留Nupedia的同时,上线了一个叫做Wikipedia的子域名,先实验一下。

刚开始的时候,吉米·威尔士对开放编辑非常非常担心,以至于会在这半夜惊醒,去网站监视正在添加的内容

让人惊讶的是,Wikipedia仅仅上线几天,文章数量已经超过了Nupedia!

到2001年年底,维基百科已经有了2万多篇文章。

网友们展示了极高的热情,文章更是如潮水般涌来,很多都是好文章。

他们担心的垃圾文章现象并没有发生,仅仅6年以后,英文维基百科的条目数突破了200万,成为有史以来最大的百科全书,打破了之前由永乐大典保持了600年的世界记录。

这确实是一件非常神奇的事情,全世界的网友在互相不认识的情况下,在一个虚拟的社区完成了最大规模的协作。

更厉害的是,维基百科的准确度很高,2005年,《自然》杂志对维基百科和大英百科全书的42个科学条目进行了同行评议,发现维基百科平均每个条目有4处不准确之处,大英百科则有3处左右,差别不大。

有学者研究表明,维基百科成功主要有两点:

(1)给贡献者提供了较低的交易成本,并且它淡化了内容的社会所有权

编辑维基百科很容易,而且是即时的,几乎无需承诺。很难分辨谁写了一篇文章,谁编辑了这篇文章,这实际上鼓励了贡献,“低文本所有权带来了更多的合作。”

维基百科的无作者结构降低了一些人做出杰出贡献的压力,因为名声的吸引力既可以鼓励贡献,也可以阻止贡献。

(2)利用了“边际贡献”

任何人都可以这里写一句,那里写一段文字,这些贡献加起来就变成了文章,这些文章加起来就变成了百科全书。

2

2003年,吉米·威尔士成立了一个叫做维基媒体(Wikimedia)的基金会,以非盈利的方式资助维基百科的发展。

既然是非盈利的方式,商业广告之类的东西就没法搞了。

这么大的访问量,没有商业广告,确实是可惜,要知道,Google通过广告的收入每年就有两千多亿美元。

基金会的资金来源有两方面,首先就是来自读者的小额捐款(也就是文章开头展示的那些募捐),其次是来自慈善组织和科技公司的资助。

另外为了实现长久的发展,维基媒体还设立了一个特别的捐赠基金,希望10年内能筹集1亿美元,实际上,仅仅5年时间,亚马逊、Google、Facebook等巨头和其他一些富豪的捐款就帮助它实现了1亿美元的目标,如今已经超过3亿美元。

维基百科用“世界上最好的编程语言”PHP编写,最早采用单台服务器,后来扩展为分布式架构,2009年的时候,维基百科的服务器达到了300多台,其中佛罗里达有300台,阿姆斯特丹有44台。

有消息称:“1000万美元就可以轻松维持维基百科的正常运转”,毕竟,维基百科不是那种“交易型”网站,它主要是“读”,“写”很少。

2022~2023年维基媒体的财务审计报表显示,维基媒体年收入为 1.802 亿美元,年支出为 1.69 亿美元,净资产为 2.55 亿美元。

可见维基百科是不缺钱的,它的资金可以让它安全运行几十年。

那么维基媒体的钱,都去哪儿了呢?

从审计财报中可以看出,维基媒体的工资和福利支出高达1亿美元!占了年支出的60%,而“Internet Hosting”只有“可怜的”300多万美元。

维基百科的高管团队,个人年收入高达30~40万美元,更夸张的是,维基百科专门从事募捐的员工数量就高达40人!

数以千计的志愿者为维基百科免费工作,推动着它不断获取成功,他们的努力并没有任何实质性回报,而维基媒体基金会却为员工的烹饪课、按摩和健身房会员资格提供不菲的资金,这不免让人深思了。

维基媒体还开发了一些新业务,比如维基词典,维基导游、维基文库等等,这些肯定也需要资金投入,但是它们和维基百科类似,内容都是由志愿者贡献的,维基媒体所付出的主要是维护成本,这很低的。

实际上,大型非盈利机构通过积累资金储备,未雨绸缪,来防止未来的资金短缺,这是很正常的一种模式。

但是维基百科那种募捐的态度,让人不可理解,仿佛不捐款,维基百科明天就要倒闭一样。

这种卑微的募捐如果年复一年地搞下去,肯定会让人心生厌恶,慢慢地一个新的替代品就会出现,来颠覆它了。

全文完,觉得不错的话点个或者在看吧!

コメント欄

まだコメントがありません。最初のコメントを投稿しましょう!

弦圈热门内容

为什么有了uwsgi 还要 nginx 服务器?

有关nginx的简单介绍,详见Nginx服务器反向代理。uwsgi是python的一个通信协议,同时也是一种web服务器,而nginx则是高性能反向代理的web服务器。在Django项目服务器部署中,uwsgi几乎是不可替代的。然而部署好了uwsgi,其实django接口已经能够响应请求,为什么还要额外配置nginx服务器?因为,相比于直接将真实地址暴露在公网上,在外面套一层nginx安全性更高,具体如下:安全问题,程序不能直接被浏览器访问到,而是通过nginx,nginx只开放某个接口,uwsgi本身是内网接口,这样运维人员在nginx上加上安全性的限制,可以达到保护程序的作用。负载均衡问题,一个uwsgi很可能不够用,即使开了多个work也是不行,毕竟一台机器的cpu和内存都是有限的,有了nginx做代理,一个nginx可以代理多台uwsgi完成uwsgi的负载均衡。静态文件处理效率问题,用django或是uwsgi这种东西来负责静态文件的处理是很浪费的行为,而且他们本身对文件的处理也不如nginx好,所以整个静态文件的处理都直接由nginx完成,静态文件的访问完全不去经过uwsg ...

Vertically aligning CSS :before and :after content

I am trying to centre the link with the image, but can't seem to move the content vertically in any way.<h4>More Information</h4> <a href="#" class="pdf">File Name</a>The icon is 22 x 22px.pdf { font-size: 12px; } .pdf:before { padding:0 5px 0 0; content: url(../img/icon/pdf_small.png); } .pdf:after { content: " ( .pdf )"; font-size: 10px; } .pdf:hover:after { color: #000; }

数据清洗之异常值处理

在数据清洗过程中,异常值处理是一个非常重要的步骤。异常值,也称为离群值或异常点,是指与大多数观察值明显不同的观察值。这些值可能是由于测量错误、数据录入错误、设备故障或者真实现象的特殊情况而产生的。异常值可能会对数据分析和建模产生负面影响,因此需要进行适当的处理。下面是一些常见的异常值处理方法:删除异常值: 最简单的方法是直接删除异常值。这种方法适用于异常值数量较少、对数据整体影响较小的情况。但是,如果异常值数量较多或者对数据整体影响较大,则不建议使用这种方法。替换异常值: 可以用数据集的其他统计特征值(如均值、中位数、众数)来替换异常值。这种方法可以保持数据集的整体分布特征,并且相对于直接删除异常值,对数据的影响较小。分箱处理: 将数据分成多个箱子(bins),然后用每个箱子的均值或中位数来代替箱子中的异常值。这种方法可以减少异常值对整体数据的影响,并且保持了数据的整体分布特征。基于模型的方法: 可以使用回归、聚类或其他机器学习模型来识别和处理异常值。这些模型可以自动识别数据中的异常值,并提供相应的处理方案。使用离群值检测算法: 可以使用一些专门用于检测异常值的算法,如孤立森林、局部异 ...