找到相关内容 22
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用20
员工离职之痛吴言今年是订的初四的回程火车票,因此初四早晨就得动身,走到十几里外的汽车站做车。从初三下午开始,父母就在给吴言收拾行李,虽然吴言一再说路上带着不方便,但是父母还是顽固地给他收拾了整整一袋子东西,吴言每次回京,拎着父母都舍不得吃的东西,都深深地体会到了亲情的沉重。这次春劫,吴言觉得将春节叫春劫更合适,吴言一共
http://cyqdata.com/cnblogs/article-detail-52889 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用19
春节虽然离春节还有一个半月,但是过年的气氛已经开始变得越来越浓了,人们已经开始谈论着买回家的火车票,行程安排等等信息,周围都迷漫着越来越浓的年的味道。每年到这个时候,吴言都会感到未名烦燥。又一年过去,又是一事无成,今年尤其如此,连往年还算说得过去的工作都没有了,而且自己的终身大事也依然没有着落,想起要回家,面对亲戚朋友
http://cyqdata.com/cnblogs/article-detail-52846 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用18
英语复习课终于完成了商品相似度计算程序,吴言伸了个懒腰,走到窗前准备放松一下。吴言站在窗前向窗外望着,今天天阴得特别沉,才三点多钟,屋里就必须要开灯了。空气中迷漫着浓浓的水汽,仿佛可以拧出水来似的,应该是快要下雪了。转眼已经进入十二月份了,离自己离职创业已经有将近四个月的时间了,自己的项目到现在前景还不算明朗,一想到这
http://cyqdata.com/cnblogs/article-detail-52820 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用17
专注还是活着转眼一个月过去,吴言的项目在缓慢但是坚定的进步着,再有两三个月,这个产品应该就可以上线了,这使吴言很欣慰。但是这个介于alpha版和Beta版之间的版本上线之后,下一步再要做什么吴言目前还没有很好的打算。这天吴言正在做着程序,忽然接到了同学钟永发的电话,吴言与钟永发大毕业后的联系并不多,只知道他去了江西的一
http://cyqdata.com/cnblogs/article-detail-52783 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用16
工作中的细节吴言的新公司好像一切都进展得很顺利,经过一周左右的磨合时间,大家彼此都变得熟悉起来,每个人也基本进入了工作状态。吴言对此非常满意,第一次转型做管理的自己,在最关键的第一周并没有出现大的失误,这个小团队已经开始工作了。但是吴言还是注意到了一些问题,虽然这些问题很小,但是吴言觉得还是需要做些处理才行。吴言首先发
http://cyqdata.com/cnblogs/article-detail-52665 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用15
第一次公司全会今天是吴言约定的三个新员工报到的第一天,吴言提前就把办公室的卫生又好好搞了一遍,同时为他们分配好了座位,赵文涛和李卫东同是做开发的,坐在主卧靠窗的两个座位,曾玉洁将会做产品录入以及部分软件质量保证的工作,坐在客厅里,自己也先不坐在自己的办公室,而是坐在客厅里,这样沟通更方便。安排好所有的事情之后,吴言就开
http://cyqdata.com/cnblogs/article-detail-52607 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用14
第一批员工吴言把自己租的房子换成了一个临街的两室两厅的单元房,里边只有简单的装修,并且没有家居和家电,虽然每月3500的租金有些贵,但是却可以同时解决吴言住宿和办公问题,吴言还是觉得挺值的。吴言首先买了个简易的地毯,铺在了原本是地砖的地上,因为这样可以防止电脑椅来回移动时产生的噪音影响邻居。然后吴言在比较大的客厅和主卧
http://cyqdata.com/cnblogs/article-detail-52566 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用13
半部论语创企业吴言自从创业到现在也没有多长时间,但是在这些天所经历的起起落落、悲悲喜喜却比过去的总和还要多,有时侯真的感觉心力憔悴,现在他深深的意识到应该加强自身的修养了。吴言以前有一个习惯,就是每次遇到职业瓶颈时,总喜欢买一本励志学或成功学的书来看,所以这类书是除技术类书籍外数量最多的书了。吴言一本一本的翻着这些书,
http://cyqdata.com/cnblogs/article-detail-52514 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用11
股权激励之惑终于通过程序可以把京成商城所有产品的页面全都通过网络爬虫程序全部下载到本地来了,吴言心满意足坐在了电脑椅的靠背上,这才发现自己已经足足一动不动的在这编了将近五个小时的程序了,好累呀,吴言很有成就感地伸了一个懒腰。“哎呦!”吴言不小心把堆在电脑桌上最上面的一本书碰到的地上,低头一看,那
http://cyqdata.com/cnblogs/article-detail-52398 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用8
辞职创业吴言在经过了几天的反复思考,终于下定决心辞职创业了。做出这个决定真的需要很大的勇气,因为自己的年纪做为程序员来说,已经属于很高龄了,如果创业失败几乎没有退路,再找工作将很难,合适的工作几乎是不可能的。但是如果一辈子就这么重复着当下的生活,他又不甘心,非常的不甘心,放弃一切也要尝试一把的诱惑使他难以抗拒。整整一个
http://cyqdata.com/cnblogs/article-detail-52284 
全文检索、数据挖掘、推荐引擎系列3---全文内容推荐引擎之中文分词
基于内容的推荐引擎有两种实现途径,一种是根据条目的元数据(可以将元数据理解为属性),另一种是根据条目的文本描述信息。本系列中将先描述基于条目描述信息的全文检索实现方式,然后描述基于元数据的内容推荐引擎实现方式。 对于基于条目文本描述信息的内容推荐引擎,目前有很多资料可以参考,基本步聚是先对文本内容进行分词,包括提取出单
http://cyqdata.com/cnblogs/article-detail-52276 
几个数据挖掘相关网站及其评价(2)
一个中文的数据挖掘网络资源的索引:“数据草堂:优秀的数据分析师应该关注哪些网站”(http://blog.sina.com.cn/s/blog_5fc375650102dqri.html)。   一个入门级的网站:网站分析在中国(http://www.chinawebanalytics
http://cyqdata.com/cnblogs/article-detail-52240 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用7
创业餐厅 正在吴言为能有机会和VC面谈这一问题一愁莫展的时候,事情突然有了转机,吴言听人说,中关村这边有家创业餐厅,创业者不仅可以在里面办公,还可以在那里很方便的见到著名投资人,而且那里的投资人都对早期项目感兴趣,并且这个地方刚办几个月,就有好几个在那里长期办公的团队获得了天使投资。 竟然还有这样的机构,对自己这样的创
http://cyqdata.com/cnblogs/article-detail-52172 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用5
互联网创业宝典 吴言这几天参加了无数创业交流活动,看了无数的创业网站,但是本来很清晰的创业思路,恶补了这些创业秘诀和宝典之后,变得越来越糊涂了。 吴言决定请教高人来指点一下,自然他想到了同学小A,小A是他上学睡他下铺的兄弟,真名叫陈永强,因为上学时总是考试都得A,所以才得到小A的称号。小A毕业后一直做销售工作,开始时小
http://cyqdata.com/cnblogs/article-detail-42783 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用3
通向管理之路吴言今天又起了个大早,来到写字楼的大厅时还不到八点,平时拥挤的电梯间现在还空无一人,吴言过去按下了上楼的按钮。“嗨!老吴,早呀!”吴言回头一看,原来是行政部的程静,是个特别活泼开朗的外向型小姑娘,在研发部里很有人缘。“你也挺早呀!”吴言回了一句。“
http://cyqdata.com/cnblogs/article-detail-42679 
最老程序员创业札记:全文检索、数据挖掘、推荐引擎应用2
吴言的直接上司张宏宇比他小10岁,是一个北大毕业的硕士,头脑相当灵活,办事效率非常高,常常别人还不明白是怎么回事的时侯他就恍然大悟了。他的头衔是研发总监,实际上就是研发部门经理,手下有20几个人,他还有一个漂亮的女朋友,靓照就放在笔记本的桌面上,每次开会时,都让这些程序员们眼馋得直流口水。哎,天下的好事怎么都让他一人占
http://cyqdata.com/cnblogs/article-detail-42559 
SQL SERVER 数据挖掘中的几个问题(四):如何实现Web 路径流挖掘
最近与一个客户的开发团队探讨和学习SQL Server的数据挖掘及其应用。有几个比较有意思的问题,整理出来 关于数据挖掘的基本知识和学习资料,可以参考http://msdn.microsoft.com/zh-cn/library/bb510517.aspx   上一篇:SQL SERVER 数据挖掘中的几个问题(三):理解聚类算法和顺序聚类算法   上一篇解释了聚类算法和顺序聚
http://cyqdata.com/cnblogs/article-detail-42037 
SQL SERVER 数据挖掘中的几个问题(三):理解聚类算法和顺序聚类算法
最近与一个客户的开发团队探讨和学习SQL Server的数据挖掘及其应用。有几个比较有意思的问题,整理出来 关于数据挖掘的基本知识和学习资料,可以参考http://msdn.microsoft.com/zh-cn/library/bb510517.aspx   上一篇: SQL SERVER 数据挖掘中的几个问题(二):理解列的用法(Predict和PredictOnly)  
http://cyqdata.com/cnblogs/article-detail-42022 
SQL SERVER 数据挖掘中的几个问题(一):理解内容类型
最近与一个客户的开发团队探讨和学习SQL Server的数据挖掘及其应用。有几个比较有意思的问题,整理出来 关于数据挖掘的基本知识和学习资料,可以参考http://msdn.microsoft.com/zh-cn/library/bb510517.aspx   1. 如何理解Continuous(连续),Discretized(离散化)和Discreted(离散的)的区别 这是对于在数据
http://cyqdata.com/cnblogs/article-detail-42019 
PyMining-开源中文文本数据挖掘平台 Ver 0.2发布
项目首页: http://code.google.com/p/python-data-mining-platform/ (可能需翻墙) 目前比如tutorial, install, release等内容,已经更新到项目首页的wiki中   项目介绍: 这是一个能够根据源数据(比如说用csv格式表示的矩阵,或者中文文档)使用多种多样的算法去得到结果的一个平台。 算法能够通过xm
http://cyqdata.com/cnblogs/article-detail-38585