Archive for the ‘Realize · 发现’ Category

张弛无度,耗电猛增

这“张弛无度”说的是我自己,这“耗电猛增”说的是我的新电脑。

十一以后,认真地琢磨11月份要上交的一份研究报告,发现前段时间做的数据挖掘工作似乎是有点问题的。彭州赈灾时期的一些数据整合以后,画出曲线来,瞅着挺滑顺的,可就是不能明白究竟表达了什么意思。

想想我们…….少年时候学解析几何……青年前期学微积分……青年后期学正态分布、马尔可夫过程……现如今,用excel画分析图表的确是神速,可是盯着显示器上那些线型、面积,还是只有茫然~~

绝望了半天以后上书店去买书,然后在网上再订书,同时在书架上死命地翻,把以前买的社会学调查、论文集什么的一直没好好看的书都翻出来了。有两个星期啥也没干,连电脑都没咋开,潜心自修《应用统计学》《商务与经济统计》《社会研究方法》等等~~终于,还是给俺学懂嘹。

事后,找boss表功,面对着一沓子打印出来的图表,洋洋自得,做目光深邃、捻须微笑状。多么难得啊,这么一把年纪了还自修成功一门数学~~

其实心里是暗狠不已的:这几门课俺们都学过地~~有些还学了好几遍~~可是为啥就是嘛也不明白呢~~以前不知道原因哦,现在知道了:全是因为当初选的教材太烂,通篇公式推导,就是不好好讲应用环境,好好地一门统计学给先生当成了数学课在讲。

这事儿跟身边的几个在读硕士一印证,他们也说,他们现在的概率论老师还是那副做派,一上课就撸起袖子往黑板上一趴,刷刷刷顷刻间就是一片公式哦,简直就是刷屏,而且刷完之后做陶陶然自得其乐状~~

哼,不管如何被破坏、打击和摧残,俺们还是不屈不挠地自学成才嘹~~

到了10月20日左右,收到一篇通知,号召大家在10月30日前紧急投稿给一个杂志社。因为此次专题正是赈灾啊物资啊什么的,我就再次闭关,呕心沥血写论文去。 (更多…)

都铎王朝

我喜欢看历史剧。尤其是制作精良、真能说明白一点事情的。

这《都铎王朝,2007》第一季短短十集,断断续续看了怕有半年。拖啦这么长的时间,说明了两个问题:其一,故事不那么精彩,看完一集之后没有连续钻研的兴致,能放放松松去睡觉;其二,每一集的故事都讲得很清楚,印象深刻,隔段日子再去看不至于犯糊涂。

因此初看的时候觉得不如《罗马,2005》好看,不过全看完以后觉得制作算是精良。

“都铎”是一个姓氏,“都铎王朝”指的就是这一家人前后110年的统治。这仍是一个封建王朝,但是就在这个王朝手里,英国大治,从封建制度向资本主义迈出了一大步,把欧洲列强远远抛在了后面。

说起来这个家族,名人可就多了。电视剧是从二代目八卦主角亨利八世开始的,在第一集里面也出现了他女儿,日后凶名在外的女王“血腥玛丽”。那会儿,这孩子的妹妹,日后也是大大出名的女王伊丽莎白还没出世。

亨利八世已经够凶蛮的了,为啥她女儿也这么猛呢?因为这可怜小孩的爹妈要打离婚……
(更多…)

512db:这个项目与web 2.0的差距有多大

512db带给我的反思,归结起来有三条,抽时间逐个写来:

这个项目是如何跌跌撞撞上线的
这个项目为啥没有足够的推广
这个项目与web 2.0的差距有多大

三、这个项目与web 2.0的差距有多大

从2005年7月8日注册gmail,2005年12月25日注册豆瓣,到如今,已经尝试过了很多web2.0的旗帜网站了,更别提早就在用的象 BT、电驴这样的应用,在《什么是web2.0》看来也属于 web2.0的范畴。

有趣的是,这篇O’Reilly的经典文章写于2005年9月30日。今天,我用他的观点来检验我自己在2008年的应用。在实践的基础上作出的认识,感觉深刻很多。

数据是下一个Intel Inside

每一个重要的互联网应用程序都由一个专门的数据库驱动:Google的网络爬虫,Yahoo!的目录(和网络爬虫),Amazon的产品数据 库,eBay的产品数据库和销售商,MapQuest的地图数据库,Napster的分布式歌曲库。

“SQL是新的HTML”。数据库管理是Web2.0公司的核心竞争力,其重要性使得我们有时候称这些程序为“讯件”(infoware)而不仅仅是软件

应用程序越来越多地由数据驱动。因此:为获得竞争优势,应设法拥有一个独特的难于再造的数据资源。

软件的价值是同它所协助管理的数据的规模和活性成正比的。

这点我深感认同,目前我提供给用户的,就是在线对数据库的操作:在人员库里面搜索,在匹配库的基础上对比、操作、电话通知。

而且,这些寻人数据库都在做同质化的竞争,数据规模的大小直接反映了网站能力的强弱。比如 成都全搜索 手里掌握了大量的医院提出的伤员名单;搜狐的留言板里张贴了最大数量的一批寻人数据;google将这些网站的数据尽量抓取过来;我的网站是在这些的基础上做精确匹配,并提供方便的志愿者协调机制。

但是因为没有人得到了彻底“独特”的数据资源,所有这些网站在后期几乎都不具备什么独特的竞争优势。

用户增添价值,把用户作为共同开发者来信任
(更多…)

512db:这个项目为啥没有足够的推广

512db带给我的反思,归结起来有三条,抽时间逐个写来:

这个项目是如何跌跌撞撞上线的

这个项目为啥没有足够的推广

这个项目与web 2.0的差距有多大

二、这个项目为啥没有进行足够的推广

一定的推广工作还是做了地。

最初,网站的全部原始数据都是志愿者们整理的。后来,大多数匹配数据的检查和通知也是志愿者们做的。这都是吆喝的结果。

不过这次,推广的力度和效果都勉勉强强~~表面上看起来的原因是:时间。

在网站全部就绪之前,完全没有推广。因为那时候不知道这么罗嗦的功能是不是能做出来,这些数据匹配算法是不是真能起作用。

所以做数据的志愿者们一开始热情万丈,拖到一个月之后,渐渐就没声音了。到了全部功能级成功实现的时候,毕竟已经是6月中旬,在网上喊好几声,才会冒出一个愿意做点事情的人。

当然这不是志愿者的问题,是时间的问题,热点消退,热情在全国各地都渐渐消失,大家都在渐渐恢复原本的生活。顾虑到这点,我除了在QQ群里面拉拢了一次、效果不显之外,仅仅在志愿者集中的论坛上发帖推广了一下。期间还遇到一些质疑,被迫做了一些解释。

随着这些互动,开始有志愿者登上网站,配合清理数据,也有人愿意帮助打电话通知当事人。 (更多…)

512db:这个项目是如何跌跌撞撞上线的

512db.cn 已经基本上完成了他的历史使命,就要走到尽头了。我迟迟不愿意动笔写下来这段时间的奋斗和挣扎,是出于一种不忍心,因为一旦真写出来了,那这个故事也就该结束了。

带给我的反思有三大条,抽时间逐个写来:

这个项目是如何跌跌撞撞上线的

这个项目为啥没有足够的推广

这个项目与web 2.0的差距有多大

一、 这个项目是如何跌跌撞撞上线的

最初的3天:

5.16,我老妈看我整天想跑前线,说可以考虑做一个寻人网站嘛,发挥特长,也算做贡献哦。
5.17,放弃了去北川前线的活动,而去探讨技术可行性了,然后获得了初始资源。(这时候已经调拨到一台服务器,这一天没有力争把服务器安装到位,是一个巨大的错误,详述如下)
5.18(周日),技术成员确定,方案确定,已经投入开发。同时我已经申请了域名和email等等。这一晚整个技术队伍熬通宵,到第二天中午,测试系统已经上线了,就是最早看到的那个基调黑色的一组页面。

然后就出问题了:

5.19(周一),预定这天抬服务器…可是发现工地上根本找不到人来给抬到互联网机房去。
5.20,服务器安装到位。这一天却遇到了经典事件:媒体不断散发余震消息,弄得整个成都人心惶惶,没人肯呆在屋里干活儿。我们的技术主管在住帐篷,他倒是带着笔记本,可是没有网络连接,也就没法工作。
5.21,配置DNS发现问题,别人访问不到网站。
5.22,配置DNS的人被单位组织去参与赈灾活动了,一整天不在。到了临下班的时候,救世主终于回单位了,很快调整完毕,我在QQ群里面发布了一条消息,告诉大家网站终于开通了。 (更多…)

被信息公告吓了一跳

话说,这几天双目无神的人满街都是….各种帐篷和窝棚满街都是…. 上班的时候看到有QQ群发:

近期生活状况:震不死人晃死人,晃不死人吓死人,吓不死人困死人,困不死人累死人,累不死人跑死人.到最后,地震不来急死人。

比地震可怕的是余震,
比余震可怕的是预报余震,
比预报余震更可怕的是预报了余震却一直不震

话说,前天晚上俺正在奋力组织整理幸存者名单,很多消息传过来,说电视上都在播放余震通知啦,说19~20日会有强余震啊,还不快跑哇~~

遂专门注意了一下电视窗口(这几天都是开着电视卡在上网)。开始还不觉得,后来发现这个播送的方法越来越邪乎啊……到12点左右,居然电视台别的都不播放了,直播这条余震通知,可吓人着呢。再加上这是记忆中历史上第一次直接播放余震预告,联系起来是越发地吓人啊。

12点,披挂整齐上街……555…..晚节不保啊,想想512当日我都是在家里呼呼大睡的啊……

一直在人山棚海中晃到凌晨2点钟,又听到有蹲在桥头被窝里的人在放收音机,里面正在播放另一条措辞稍微温和些的预报,特别注明说余震不会影响成都市区云云。但是跟着还是说,住危房和旧房的群众,酌情到空旷地带躲避。啊,其实有前一句就行了,我家肯定不是危房的说。

想了想,决定回家睡大觉去了。但是鉴于整栋楼里面估计也没几个人,想了想,最后还是和衣睡的沙发。

第二天又约了人上工地 ,这一伙人戴着安全帽急匆匆才闪进工地里面,就有电话来通知说最好紧急撤离……555……这好好的又来吓人做啥嘛……遂快手快脚赶紧把事情办完,急惶惶跑出去算是。

回到家才知道,电视上花了一整天的功夫播放安民性质的专家访谈。看起来是认识到了昨晚的发布方式有些欠妥,试图消除影响呢。

对我而言,几十年来第一次在公开场合发布避震消息,这是我们的一大进步,刚好被我赶上了。想想看,拍板决定要这么做的人需要多么大的勇气、承担多么大的压力。期间虽然有些执行上的不尽人意之处,亦导致我仓皇出逃一次,总的来说,我很欢迎。

救灾的声音

不断地打电话和联系中,没时间多写字了。搜救活动随着时间渐渐收尾,下面的主题是疫情和安置。

听到的声音中比较有代表性的包括:

救灾的管理困难——我的紧急呼吁(牛博)

我在去汶川的路上,寻找…(豆瓣)

民间团体救灾特刊 第三期(5月16日情况通报)(NGOcn)

议院内外之运作方式

上班的时候太忙,没时间多写。

中午看zenphoto的故障说明,结果翻到篇《美国网站的一篇博文:谁在制造骚乱?》,感觉不错,这估计是一个中国人在分析这次zd事件背后的力量,他通过wiki研究了一些有关的受美国人资助的电台,一些美国人的游说团体,以及政策制定人的背景。

那结论是,西藏人被利用了,佛教也被利用了。

被谁利用呢,那些“不关心争斗是什么,只关心争斗的时间有多长”的人。

还有些别的论点,对于这场宣传战的双方,都有很到位的观察。

这么有感触也是因为想起来刚看过的《查理·威尔森的战争,2007》,关于一个议员如何通过一系列的运作,争取到了援助,在阿富汗打败了整个苏联红军的故事。然后就是柏林墙,然后就是塔利班,然后就是911,如何如何。

那里面也是一个又一个委员会,谈判,交易,以及被引导出来的热血沸腾。

career against job

今天惊蛰。

在这一天的凌晨我在看一部好玩的啮齿类电影《艾尔文与花栗鼠,2007》 。这段时间啮齿类的上镜率很高,比如得奥斯卡的那个老鼠大厨,比如再次颠覆了童话的魔法奇缘里面的顽皮花栗鼠,似乎都在昭示着鼠年大行。

不过这不是重点。重点是,主人公被一伙啮齿类搅骚,弄得处处碰壁。这家伙在一个广告事务所工作,并且在业余时间里疯狂作曲,当这两条路都被钳断后,他说:

I lose my career…..and my job !

那意思是说,job是拿来糊口的,career是拿来承载梦想的。

晚上坐在椅子里看《编剧:步步为营》 ,嗯,这是本写作教材。这教材里面强调说:

一个剧本从写作完毕到进入拍摄,花上三年简直是惯例,搁上十年八年的也很常见……编剧生涯如同掷骰子一般不可预知,这份职业可能让你突然赚一大笔钱,但你不能以此来谋生……无论如何,不要放弃你的正当职业。

啊,前天还答应某人帮忙做做职业生涯的规划呢。问题是,我一直没有太明目张胆地认同这种将 career 与 job 干脆剥离的思路。这态度值得反思。

不过无论如何,我又开始读书了。

又一破事儿

刚上班啥还没干呢,就被恶心一把。

这几天没事儿硬盘就在狂响,昨天查了一下系统log,发现firefox的某个文件状况不对,找新版本覆盖了。今天再查,剩下的几个资源大户里就数QQ最猖狂了。

想想最近登录和发言什么的都有些不正常,估计是qq每隔半年强制升级的毛病又犯了,开始排斥旧版本和外挂版本。

奇怪就奇怪在,这个软件做是做得越来越烂,偏生推广得极为成功, 以至于五年前对这个哧之以鼻、人手一个msn的诸IT强人,最近也是纷纷回归,变成人手一个qq号;更别说那么多个qq群了。扔是暂时仍不掉的,还是只好尽量找资源占用低一点的法子。

没成想,搜啊搜的,搜出这么些破事儿来:

珊瑚虫工作室声明

珊瑚虫声援站

流氓还真是满街都是,什么年头啊。

——-update 2008.03.30—–

一审判决在3月20日已经下来了。

Switch to our mobile site