Monthly Archives: October 2005

收集的php网站

收集的php网站http://phpclasses.dev.skypp.com/browse/

Posted in Uncategorized | Leave a comment

case time

case “data_date”: /*不确定年月的处理,’去年(-1),前6个月(-6)’ 用文章时间与提出时间的名字相加得出真正时间*/ //for($i=0;$iname; if ($myData[$order-1]->other == “data_link”) $myData[$order-1]->attribute = $myData[$order-1]->other; if (($type == 1) && (strpos($name,”year”) == true)) {//如果是今年类型的,需要向前找。 $name =substr($name,0,2); $name = substr($ctime,0,4) + $name; $name .= “年”; $query = “select id,name,type from $c where key_word=’$name’”; $result … Continue reading

Posted in Uncategorized | Leave a comment

关于分词规则的一些问题 FOR SUNYU

关于分词规则的一些问题 现在规则已经有500多条了吧,规则走的是人性化道路,模仿人的思考的,但是现在到了一个瓶颈(我的感觉),这几天好多的错误我没有办法动了,因为有好多问题,比如词语的二义性,比如说”北京公司”和”天津市委”和” 重庆日报”等问题,后两个词应该是提出来的,但是根据当前的规则是提不出来了,毕竟我们的规则轻向于商业。所以对于此类问题,我觉得应该细化处理,比如说构建公司特征库、政府部门库、教育机构部门特征库、新闻媒体行业部门特征库等等。这些是对当前的公司库的扩充。还有就是部门公司词的2义性问题,比如:中心、部、处。我们可以说”北京大学网络中心”中的中心是部门,”国家信息中心”中的中心是单位,但是规则读这句话的时候他不知道局句子中的隐含信息。而我们也只能用其他手段来限制,比如说子长,一般带中心的公司比较长于带中心的部门,但是,总会有落网之鱼的。这个问题我不知道怎么解决,现在解决办法是用字长限制,不知道有没有更好的办法,比如提取隐含信息。在进行处理前,先由关键词公司特征词分好处理类别,公司的做公司全套规则,行政走行政的全套规则,其他的走棋他的,走完之后分类标注。还有就是后台规则维护,现在表太大了,太不方便了,改了规则要很久。 个人以为需要讨论解决。。

Posted in Uncategorized | Leave a comment

浩然的’枫之华月’重新开张了~~

由于6to23.com的非法行为(1。没有履行赠送一个月空间使用期限的责任 2。关闭空间前没有给我任何邮件3。对于我的去信完全不理睬),我的blog数据被留在了 6to23.com的 服务器上了,鄙视6to23.com 垃圾服务商,名气越大服务越差,看看现在6to23.com算个什么学生社区。 所以我这几天看开始找寻新的blog托管服务了,我要保证我的数据的稳定性。因为自己建立blog要操心维护数据不被黑掉,找个完美的波blog程序仿佛是件很遥远的事情,所以我要找家技术实力强的公司来托管我的blog,最后找到了microsoft 的space , bloger.com ~总体看都不错的,但是microsoft 的space的数据永远是在microsoft的服务器上,感觉不是属于自己,另外也不能加domain.所以就用了bloger.com 另外用bloger 可以在 ms-word里写自己的blog,很方便的~~简直是酷比勒。 好喜欢阿。这样写自己的文档什么的都可以传到自己的blog里,可以分享,可以做档案私用,并且数据可以放在自己的网站里,就算bloger.com挂了,数据还在。最爽的就是我始终用我自己的域名,其他的网速,空间商的威胁,程序的漏洞都可以不管了,好爽。思考从这里开始,思维继续。。。一个成功人是善于思考的人,并且把思考的东西写下来的。别人说的,呼呼。一个成功的商人,是把自己写下来的东西,拿出来分享的人。我说的,呵呵。

Posted in Uncategorized | Leave a comment