[转贴征文]重构互联网的可能

hping 发表于 2012-4-21 21:21:45

互联网技术已经走过了40多个年头，全球互联网的流量将增加到每月10亿GB，全球数据总量每三年就会翻一倍，全球拥有超过5000亿GB的数据总量，IDC/EMC的研究报告估计,支持这数字宇宙正常运作的计算机、网络及储存设施总计成本为六万亿美元左右.再加上医疗设备、娱乐及内容制作相关成本,总计开支比这个数字(即六万亿美元)的一倍还多，我们面对的是超级复杂的数字宇宙大爆炸的时代，与组成现实宇宙的基本粒子不同的是这个宇宙的基本元素是0和1。这些由0和1组成的数据信息被分散在不同的数字宇宙孤岛之上，即各个网站，搜索引擎在不同的孤岛可星系之间采集我们需要的信息，我们的信息渴求还在不断的增加，我们不断的用各种关键字在搜索引擎上查找着什么，但还是时常找不到想要的东西，因为目前的互联网的信息缺乏着某种更本质的关联性或结构性，以前我们做信息化强调需要结构化的数据，现在我们可能需要更进一步说，我们需要结构化的信息，以全面的满足所有记录、查找、分析、统计的信息需求。现在的搜索引擎技术主要基于网络爬虫、索引系统、排序系统、链接分析，简单些说，它只是把现在的网页进行存储，然后建立一个索引及排序方式，再根据用户的请求给予显示推荐，关键字是它的最大优势与核心，所以它只能满足基本的通用搜索需求，比如查找城市的介绍，某一个特定的知识，它无法满足更复杂的组合或特定条件的搜索，所以你会找出一系列的无用信息，随着社交网络的复兴，Facebook和微博这些形式的SNS发挥了一些更精确的搜索引擎作用，这其实核心是一种人肉搜索的模式，但这些都没有解决根本的问题，当垃圾堆的模式不改变的情况下，再好的捡宝机器或个人也徒劳兴叹。有没有可能我们重新审视互联网的内容结构，从内容本身与形式本身着手，来解决根本问题呢？在微博中最多是对一个新闻或事件进行评论，但问题是，同一件事件（新闻），它由许多网站或网面或个人进行编制，因此对它的转发与评论最终仍然是分散的，此是其一，其二对事件的描述形式不是结构化的，它缺乏组织、地点、人物、时间等结构化的信息，这导致无法对事件的影响进行分析。其三是每个人本身只对打一大堆字进行说明，没有结构化的数据进行整体的表达，比如前段时间的宪法修正案，到处都有信息与评论，但都是文字，没有一个集中的投票场所，这样制订者事实上无从得知一个相对精确的整体情况，比如到底有多少人参与关注过此事，多少人呈反对意见，多少人赞成或无所谓。这样的情形会在任何一件网络事件中得以体现，比如昨天我去海底捞吃了一顿饭，我对其中的一个菜或服务员不满意，我又在微博上或其它的地方唠叨了几句，这样信息记录与储存结果是非常局限性的，海底捞不可能所有的互联网的信息捞出来得到反馈（你也许会说，你可以去他们网站去投诉啊，但我他妈的就是懒，就只在新浪微博上叫一叫），我的朋友以后想去海底捞时，想看一看他认识的人都对海底捞有啥评价，那他除非把我的每一条微博内容记住，不然他也得不到有效的信息反馈，事实上我发出来的信息是希望产生既发发唠叨，也能促过海底捞进步，也可以对我的朋友的行为产生一些影响的。这种现象你会发现在许多现实状况下，你对一本书的评论，你在豆瓣上写了只存在豆瓣的网站上了，当然你会说现在微博可以同时转发了，但这也不根本解决之道，因为书评网站可能很多，即便全部把内容丢到微博上了也只是凌乱堆积而豪无组织而言，因为这些信息在当时被阅读后，无法后续被利用，更无法被用来做大尺度的统计分析。所以现在微博上面用一些标签的方式，其实就是试图解决这一问题的，这也是百度自己搞新闻或词条之类的原因，但是我相信Facebook跟微博们还是没有找到最终解决之道，事实这个问题也不是仅仅靠它们可以解决的。当信息没有规格设计的时候，仍靠搜索引擎只能解决非常通常的问题，依靠社交网络可以对某一个特定问题进行解决，但它本质上跟你用电话问人没有区别。当这些需要去网络上采集信息的网站采集不到有效的信息时，它们想到的办法是自己来组织与编制，这就是百度与腾讯以及Facebook们越来越大的原因，在表象看起来是它们都是为了掘取最大的用户流量，其实本质上用户是因为内容而停留，内容才是主要的。最开始我不理解为什么Facebook会威胁到Google，后面才知道，原来Facebook其实是搞了人肉搜索，可以比通用的搜索引擎更精确化，但后面我不认为Facebook真的可以对google形成实现的威胁，如果是那样的话，facebook的本质就发生了变化，它就不是Facebook了。国内做为信息内容的最大制造者，腾讯做得更差，QQ、QQ新闻、ITIL培训基地、空间、微博这些越弄越乱的信息规划布局，由于极度缺乏一个信息规划师来信息内容的规划，以便把一个用户的信息流管道很好的从底层到页面做好设计与表达，结果是由于想通吃，结果丢出来一堆的杂碎，腾讯按这样的模式弄下去，微博将越来越有可能把它的QQ用户全部盗窃光，腾讯现在对互联网的创新影响是负面的，以攻代守的策略最终可能葬送掉最开始的核心优势。想象一个这样的互联网世界，任何一个现实世界的对象，无论这个对象是一个星系、星球、地区、城市、楼宇，还是一个国家、政府、协会、公司还是任何类型的组织、又还是一个人，一个动物或一个产品，又还是任何一个事件（新闻、消息），都被完整的描述以及存储下来，每一个对象之间可以建立某种连接（关系），不管是地理与人、还是人与人、还是人与事件，还是事件与事件，还是事件与地理、事件与对象，任何的信息（无论是你的唠叨还是评论还是文章）都与对象相关（任何东西都是对象，一如佛家所说的法界），当对象以规格的形式被描述后，并且对象可以与对象进行关联，那么此时的搜索引擎可以做什么，一切，当这些对象真正集结成一个网之后，一切都可以被有效的查看与分析。这将完全重组互联网的商业模式，信息的通流与对接将更加开放，每个商业组织只专注于描述自己的对象，用户的网络行为将带来关系的集结，由人驱动了网络的形成，这样每一个网站不需要再构建自己的世界，但一样可以分享商业利益。要构建这个世界，需要几个步骤，先需要有一个标准化的描述对象的方法，这也一些类似现在的ISO组织的工作一样，如何描述一本书或一只动物，或一个人，或一个事件，这其实是一个分类的过程，把对象分成若干类，每一个类用一些属性去描述它，然后去定义每一种对象之类的关系类型，即对象与对象之间可以有哪一些关系。这样就有了一个描述世界的基础蓝图，任何商业组织可以基于此来扩充它，而且这个蓝图随着应用的发展，会不断完善与深化，那个最终完善的极点就是人工智能的实现，找到康德的物自体。这个过程就好比是一个建筑蓝图，来实现构建一个世界用的。有了蓝图之后，需要有人来填充建造，谁会去干这事情呢。政府会把地理、道路与街道完善出来，每一部法律、规章也会整理出来，每一个组织、部门也会建立出来，每一个商业机构会建自己的网站，把自己的产品描述出来，以甚至自己公司定期的新闻、服务条款啊公布出来，出版商会把书本也是如此处理，电影商也会把每一部电影也如此处理，一个餐厅或酒店也会如此处理，一个旅游景点也会如此处理，要么是因为自己的商业需要而完成构建，要么是因为想依靠构建出来的信息产生商业利益，一如新闻门户，或娱乐ITIL培训基地，一个旅游景点如果把他的景点3D仿真后，人们可以用虚拟的方式去了解每一个建筑细节与每一个石头（前提是你的蓝图可以支持丰富的描述方式），而且不用体会人流如织的拥挤，而且费用极低。事实上大部份的信息已经构建出来了，现在绝大多数的组织、产品都已经有了自己的主体信息在里面了，只是缺乏标准化而无法与其它的数据对接互联。这样最终这个世界的基本可以描述完，最开始可能不是所有对象在其中，是因为没有需求，如果需求的话，一定会有人或组织去进一步刻画这个世界的细节。有了这个基础之后，每一个人的行为都可以与对象直接相关，比如我买过的书，书的信息是直接来自于出版商的数据库，经过的物流商也是如此，我对书的评论会根据我选择的对象自己本身的关系（此书是谁生产、谁运输）推送到这些组织或人，书评也可以是一个独立的网站，书评信息记录在这上面，餐厅的每一道菜也是如此，我的评论与建议同样这样处理。我对现在政府房地产新发布的政策不满，也是如此处理，其它的象一部电影、一个新闻事件等等，都是这样的，因为我所有的动作都是面同某个对象的，我只需要关联此对象即可，而这个对象的信息来自其它的地方，这样的方式的信息效率是最高，而且储存成本是最省的。更重要的是，当一个人想了解我时，只需要点击我这个对象，就会知道我的基本信息，可由政府层面的系统采集而来，我的爱好，由于蓝图确定了爱好分为、体育、电影、饮食、书本等等之类，人们可以知道一个更全面的我，而不仅仅是中粗略的爱好什么运动或类型的电影，当一个人要去看一个电影时，他可以找出所有他认识的人中对这部电影的评价，由于电影有自己的属性，如类型、时长、语言、时间、电演、演员等等，而每一个看过此电影的人有学历、地区、爱好等等，你完全可以分析出人们对电影的爱好呈现的规律，以及电影明星对人们选择一部电影的影响有多大，这些看起来以前很不容易实现的结果，由于每一个人自己的网络行为，而导致有了最全面而真实的数据提供分析的可能，这种海量数据是任何市场调查所做不到的，但从实现的机理上来说又是非常简单的，对象、关系、属性，通过对象拥有的关系找对其它对象，再根据对象的的属性来分析偏差，这个看似极其简单的模型将极其有力的帮助展示了真实世界的本质与规律。如果加上数据可视化的技术，我们将知道现在美国人关心的新闻是哪几个，或者最近一个月，深圳地区反应最好的馆子是哪几个，这将完全改变以前我们去门户看新闻的模式，任何的热点将可以按照时间、空间、人群、组织、帮助我们切入。你可以从不同的视角切入信息，比如从一个地区看有哪一些热点新闻，从Googel Earth,你可以从不同的人群在关系哪一些事件，你也可以从事件上看出它的影响到哪一些人。每一个人还可以定义自己的关系类型，包括你对任何事件或组织的看法，你的每一个关系线条，将带来力量，指向此事件或此组织，而这最终将以直观的数据形式呈现与表达，任何一个新闻，你会知道持反感态度的人有多少，（取决于定义一件事件多一个人的角度可以有多少种反应），这样的将会彻底改变信息的变形与失真问题。任何一个公司的产品与政策，都会了解到全面的信息，任何一个政府的形象与制度，都会有大量的数据反映出来，而且这些数据还可以基于历史，即你可以知道人们对一个政府的看法，在这10年中呈现怎样的趋势，甚到可以分析出，不同地区的人有什么结果偏差，不同工作、学历的人有什么结果偏差。这一系列的分析结果，需要基于良好的信息设计，它对个人、商业组织、服务组织、管理组织都是有着极其重大的正面作用的。想象一下这样的一天，当我们一出生时，就拥有自己的一个门户，这是连接世界的一个入口，这跟现在许多企业要做的企业门户是一样的，用户不用再登录不同的系统，而我也不用再登录不同的网站，我要看的，我要做的，我要写的，全部在这个门户上进行，这个门户会根据我的历史行为，抓取出新闻，推荐出我有可能感兴趣的书、电影或食物或者租户信息，垃圾邮件与都会消失，的投放将是高精度的，我对任何对象发表的信息，会以数据形式分发到不同地方，这些又进一步填充、丰富了这个世界。每一个公司专注于自己的数据与信息，而不是想尽办法把用户捆绑在自己的田地里，信息本身就是带来商业收益的，而不是依靠页面。这将是人类最大的商业智能（BI），它将以结构化的信息方式与结构化的数据存储方式来更有效的完成了内容的记录与组织，信息不再单一存储在某一个网站或某一个数据库实体中，而是按其特定的内容分别全球存储，做一处存储，四处调用，当展示或分析需要时，再由搜索引擎来组装、拼凑内容，从任何一个角度都可以切入这个数字宇宙的任何一面，如果我们有一双真正的天眼，我们会惊叹这个复杂的超纬宇宙的结构之美。这个世界一旦形成，人类会越来越追求与研究如何描述清楚一个对象，比如在虚拟世界加上三纬数据，之后这个还仅仅是把现实世界投射到虚拟的世界，一旦更深入之后，必然会更精细的配置描述，即把一个对象的操作配置也破解出来，通过在之上来操控家里的电器设备，也就是物联网与互联网相融，此时虚拟与现实的界限将会模糊，此时你想了解地球在发生些什么，看有形的世界已经不够了，需要了解数据层面在发生些什么。更进一步的，要更加真实的模拟世界，必然将每一个对象的行为数据化，比如一台车糟受撞击时的影响，它的外观与功能会如何，这又取决于撞击对象的属性，比如硬度、速度、质量、方向、位置等等，每一个对象描述了自己的行为属性之后，任何两者发生某种关系时，会计算出双方的影响，这些有形的层面都是相对容易攻克的，最后的堡垒是人的层面，如何把一个人的行为或反应能计算出来，包括人的个体行为分析与群体行为分析，那么计算虚拟社会的发展将是可能的，可以加入任何变量进行试算。AI的核心在于破解人类最后的秘密，人的本质是精神性的存在，而不是肉体性的存在，最终载体是肉体还是金属或是电子信息将不再重要，如果可以模拟一个人的行为与反应的话，事实就可再现这个人的灵魂，如果把此人的DNA记录在上面，事实就可再现此人的肉身，当把两者相结合时，也就是永生了。有意思的是，如果真的可以做到这一切，那个活在虚拟世界的不断行为反应并思想进化的人，他会如何看待他所在的世界，他的眼耳鼻舌身意都只是模拟的，他也能感觉到生理上的快感与享受，如果知道这是假的，他不就是佛陀了吗？如果它不知道这是假的，他不就是我们吗？，如果他能更改了自己的属性，那他不就是Neo吗？，那他妈的和这个世界又有什么区别？原文地址：xqscool/A1520945.html

daisy8 发表于 2012-4-22 00:28:02

Guest 发表于 2012-4-22 11:10:19

lfjianxin 发表于 2012-5-20 21:44:27

页: [1]

艾拓先锋社区's Archiver

[转贴征文]重构互联网的可能