春天我种下一块板砖,
秋天我收获一处房子。
春天我种下一个萝莉,
秋天我收获一位人妻。
春天我种下一粒精子,
秋天我收获一个儿子。
春天我把自己种下去了,
秋天别人收获……北漂童话。
2008-06-04 23:06 饭否消息
薪桂米珠居不易,买房尚早。
2007-12-19 浪淘沙
一小学老师在解析“乳“字的含义:乳即是小的意思,如:乳鸽、乳猪、乳牙……要求用乳字组词并造 句。 小明说:因为现在房价太高,所以我家只能住50平方米的乳房。 老师汗,说重造一句。 小明有说:我太小了,连1米多宽的乳沟都跳不过去。 小天禁不住站起来对小明说:你理解错了,不是这样的,应该是这样”我的头较小,所以叫乳头“ 老师说:我要晕倒…… 小明和小天同时说到:老师,你还没倒,只是乳晕!
2008-06-17 12:12 by 赵延龄小朋友
噫吁(hu)戏,危乎高哉!
买房之难,难于上青天!
首付及利息,还款何茫然。
每月两千二百元,一还就是二十年。
工资一共两千三,不吃不喝成神仙。
留下一百交物管,然后才有幸福的家园。
上有银行高额利息催款,下有天天涨价的物管。
小康生活尚不得过,节衣缩食过个年。
工资何盘盘,找份兼职也艰难。
想要装修没有钱,清水房里坐长叹。
问君房贷何时完,争取就在死之前。
但见悲鸟号古木,守着空房泪涟连。
又闻绿化被拆迁,愁空山,买房之难,难于上青天!
使人听此凋朱颜。
楼下不交钱,电梯就停电,高层公寓愁攀援。
新房虽云乐,可惜没有钱。
买房之难,难于上青天!安得广厦千万间,大庇天下寒士尽欢颜!
from 买房难
如果您不知道什么是favicon,可以移步到这个页面来扫盲,或者来此欣赏好看的favicons。
与老夫的另外一个站点“我爱正则表达式”的favicon“
”一样,本站的favicon在设计之初,先是想到了“泽”字,但是,觉得不甚美观。泽字并非不好,只是不像“正”字一样,是横平竖直的结构,做出来有些发虚。后来,灵机一动,想到了八卦符号里的“
”符号。该符号全由横线组成,与“
”一样清晰、美观,且富有对称美。都是老夫使用http://www.favicon.cc的在线工具手绘而成。
“
”符号是八卦里的第六卦:坎。八卦是:乾三连,坤六断,震仰盂,艮覆碗,离中虚,坎中满,兑上缺,巽下断。八句口诀恰如其分地描述了八个卦象的形态。其中坎卦的描述 是:坎为水卦像:重坎八纯卦;坎卦为二坎相重,阳陷阴中,险陷之意,险上加险,重重险难,天险,地险。险阳失道,渊深不测,水道弯曲,人生历程曲折坎坷。绝颠聪明,“心诚行有功”。比和卦,谋事顺畅可成,但内中有波折。肾,泌尿系统疾病,血病,妇科病,视力差,心脏病。
老夫所取的意思为:水卦像;险陷;人生历程曲折坎坷;聪明;波折;视力差。
真是多事之秋。也罢,莫谈国是。说一说饭否得了。
今天与饭否的官方沟通过饭否服务器的限制问题。起因是,本人正在写的饭否应用程序,是①,通过抓取饭否页面;②,使用正则表达式解析所需要内容实现的。最近在读取饭否页面的过程中, 发现读取一定数量的fanfou页面之后,就无法登录fanfou了。今天得到的答复是,在10分钟内抓取不得超过100页。这个确定的答案让我很满意。我不是说,10分钟100页是多是少,而是说,有定量的标准可以参考时,觉得更加有把握。
既然10分钟100页,折合每6秒1页。这个数字还是有些保守。因为我每10秒读取1页连续抓100页时,仍然会被封IP。现在我每下载1页,就sleep(15),居然可以长时间下载。替一位朋友下载了所有的饭否公信和分享,合计300多页,这个过程很顺畅,当然,也很漫长。鉴于饭否消息的特点,第一次抓取的时间,是无法快起来的。但是,一旦第一次已经把之前所有的消息下载过后,再次下载就会很快,只需“同步”一下即可,只下载最新消息,而无需重新下载全部消息。这样就能在本地完整保留所有的饭否消息,从而进行诸如查询、导出、统计之类的操作。
在没有得到饭否官方提供的最大负载数据之前,我是这样变通操作的:被封IP后重启一下ADSL猫,一分钟后即可再次登录饭否。原因是ADSL会重新获得随机IP。当然,现在可以合理地设置抓取间隔,不被封锁,才是更好的选择。
关于打包下载饭否消息的方法,其实不止使用专用程序一条途径。还见过使用其它工具(使用迅雷等批量下载网页,再使用textforever之类的工具析取的。对于这样饭友,我想和您握手。因为,咱们的思路是一样的,都是先下载,再析取。只不过使用的工具不同而已。
本人写的新版抓饭程序何时公布?对不起,暂缓。如果您对脚本感兴趣,我可以把脚本发给您,并告诉您怎么使用。完整的程序需要更长一段时间,包括脚本的完善、数据库操作、界面的更新……等等等等。
打包下载分享的数据库版本还没写出来,原因同上。
对于饭否分享,我有以下2条建议:
- 建议“已经删除”和“不公开”这两个属性分开。在批量删除时容易误伤不说,不公开的还有公开的可能,万一原消息主人再度公开,还可以再次下载。
难度:低。
- 建议在分享中加入digg思想。这个意见,拂汗提过一次。我觉得很好。发布一条消息后,每当有人分享一次,该消息的digg计数就++,删除分享一次,该消息的digg计数就–。一个人的popularity权重与所有digg计数来挂钩,从而激励大家多发有意义的言论。同时,该digg计数也给想要删除该消息的主人以参考:当想删除时,会有提示:“该消息已被N个人分享,您真的要删除吗?”
难度:较高。因为需要涉及原有表的alert操作,手术较大。再加上原有分享消息是否重新计算,等等。
有饭友对饭否提出这样的建议,我谈谈我的看法:
作为一名忠诚度很高的饭否用户,……我现在想要的几个功能是(其中有一个以前提过):
- 按照发布日期排列的“顺序阅读”按钮;
- 针对发布内容的关键字搜索;
- “每日最热词”榜单——这个纯粹是为了好玩:统计每天海量文本中出现最多的词。
by StarKnight @ 02:40 2008-06-07
rex的看法:
- 按照发布日期排列的“顺序阅读”按钮;
这是可以实现的,而且也不难。
直接在饭否网上实现:
只要在数据库查询时加上order=ASC(默认是DESC)选项,就能按照时间的顺序从old到new排序。
正如前文所说,默认的顺序是降序,即DESC,这是为了让自己和饭友总是看到最新的动态,同时也是为了上搜索引擎抓取到最新的内容。同时,只要是总消息数大于20,则无论如何,饭否第一页总是20条消息,而不满20条的,总是把零头甩在最后一页。
通过软件方式实现:
这个更简单,我原来写的饭否消息打包程序已经实现了该功能,目前正在写新版。
- 针对发布内容的关键字搜索;
这个功能无疑将极大地便利众多饭友。只是饭否官方迟迟没有提供该功能,而其同类产品,都通过自己或第三方实现了该功能。
但是该便利的前提是,让服务器更玩儿命。每位饭友的所有消息,在饭否服务器中有两种可能的存储方式:一是每人一张表,饭否ID作为表名关键字,便于搜索个人的消息(小而快);一是所有人共用一张大表,饭否ID(或其对应的内部UID)作为关键字段之一,便于搜索所有人的消息(全而慢)。无论是哪一种方式,搜索都是比较耗费资源的,尤其考虑到饭否在中国用户群最庞大,鹅毛也能压死骆驼。
因此,饭否官方这样做或许是为了避免让原本已几乎不堪重负的服务器再雪上加霜。近来饭否已经有步履蹒跚的迹象。昨天(2008年6月6日)上午出现了数小时的中断,晚21时又进行了1个半小时的服务器维护。按惯例,针对中国大陆网友的网络服务器,应该是在凌晨2:00左右维护,且应提前1至3天通知,这样才能把用户体验的影响降至最低。饭否挺住!饭否加油!
题外话:饭否的盈利模式在哪里?饭否以及海内已经聚集了大量人气,应该不会甘于只做免费服务、公益服务。跟Google比较一下,Google提供的是有广告的服务,但是它的服务强大、全面,以致于让人觉得它的广告也不那么难以接受了——不细看不深究不点击就是了,这是老夫对广告一贯的态度。Google可以便利地搜索Billion级的网页而响应迅速,实在值得做互联网的人学习。我们需要的是一个功能强大、贴心的饭否,而不是一个病如西子胜三分的饭否。
另外,使用软件的方式实现饭否消息的搜索,虽然可以定制(时间、顺序、关键词、正则式),灵活便捷,但是对一个人的消息来实现搜索不难,最多能辐射到好友,要想在茫茫饭海中打捞消息,就只能望饭兴叹了。
- “每日最热词”榜单——这个纯粹是为了好玩:统计每天海量文本中出现最多的词。
StarKnight 提出的三个问题中,在技术上来说,这是最难的一个。这个问题在英语或类似语言中不成问题,因为单词的分隔很容易实现,只要将句子按照空格或标点来分隔,再综合统计每个单词出现的频率,去掉常规词汇(a,an,the,is…),理论上能够从海量文本中统计出热频词汇。只是理论上而已。
具体到中文,单字好说,单词呢?老一辈的人可能记得生产队上的《小五更的故事》:
我的心跳起来,可千万别碰上生字。我念:“棉田——灌——溉法。”
队长的手指往下指,我就往下念:“但是——如果——灌溉——不合理——对——棉田——反而有——害——多年连——读(续)——不合理——的灌溉——会把——好地——搞成——坏地”
在处理中文断词断句时,程序可比“小五更”差远了,虽然小五更也够倒霉的。
但是,就没有解决办法了吗?非也非也。解决之道就是老夫一直提倡饭友使用、一直希望饭否官方提供支持的万能无敌TAG术:
- 在消息中使用[]或【】作为饭否tag标识符,中括号之内以“,”“,”或空格作为多tag的分隔符。
- 然后对消息中的tag作出超链接,在点击时转到所有含该tag的消息列表中。不但可以在自己的消息中寻找,还可以在公共消息中寻找。
- 还可以做成tag cloud,以出现次数排序,自然就是每日热榜词汇列表。
- 使用tag就省去了无目的、低效率的数据库操作,转换成有针对性的高效操作。
当我想到的时候,做啥已经实现该功能了。见截图:

其中,“热门话题”中大部分tag是根据消息来源自动加上的,一小部分是出自用户的贡献。如果饭否也能加上相应功能,应该增色不少。昨晚的服务器维护时段之后,本以为会出现不少新功能,但是界面、功能一如其故。或许我们该庆幸,饭否还是如约回来了……
作为即将满一年的老饭友(2007年06月28日10点30通过发布了自己第一条饭否消息:读万卷无字书,行万里冤枉路。) ,对饭否的感情是复杂的。初识时的激情已退,之所以依然恋恋不舍,一方面是相知多时积攒下不少温存的回忆;一方面是习惯的力量,打开浏览器时不自觉ctrl+d,fanfou.com,回车;最重要的是,经饭否认识的若干老友都在那里,总是抱着关切、好奇、窥视的心态,察看老友的最新消息和动向。随意浏览时,看似你一言我一语,七嘴八舌不明所以,然而相知既久,自有其连贯性。引钱钟书的《围城》作结:
譬如咱们这次同船的许多人,没有一个认识的。不知道他们的来头,为什么不先不后也乘这条船,以为这次和他们聚在一起是出于偶然。假使咱们熟悉了他们的情形和目的,就知道他们乘这只船并非偶然,和咱们一样有非乘不可的理由。这好像开无线电。你把针在面上转一圈,听见东一个电台半句京戏,西一个电台半句报告,忽然又是半句外国歌啦,半句昆曲啦,鸡零狗碎,凑在一起,莫名其妙。可是每一个破碎的片段,在它本电台广播的节目里,有上文下文并非胡闹。你只要认定一个电台听下去,就了解它的意
义。我们彼此往来也如此,相知不深的陌生人——
希望饭否官方与时俱进,能推陈出新,“老者安之(维系老用户),少者怀之(吸引新用户)”。呵呵。