![]() |
|
Spaces home Wudi's BlogProfileFriendsBlogMore ![]() | ![]() |
|
11/27/2006 搬家关闭这个 blog 后,有的时候有话没地方说,挺不方便的。 今天看了看去年就在 blogspot 注册了的 blog,发现功能增加了不少,而且似乎已经有段时间能直接访问了。 打算打算在那继续写 blog 了。 8/3/2006 关闭昨天发现 MSN Spaces 变成 Live Spaces 了,有几处主要变化:
鉴于本人对 Vista & Live 风格的厌恶,以及条目更新速度的逐渐降低,决定不在这里写 blog 了。 7/4/2006 在 Windows 上使用 Apache 2 配置 Subversion 服务器昨天把 Subversion 的服务器端配置好了,发现有些指南存在一些问题,有的甚至会误导人。 下面把我的安装过程写一下,不一定完全正确,但保证可以马上运行起来。 1. 安装 Apache 如果还未安装 Apache,先安装。注意版本只能是 2.x 的,mod_dav_svn 模块不支持 2.2。 2. 安装 Subversion 从 http://subversion.tigris.org/servlets/ProjectDocumentList?folderID=91 下载文件名形如 svn-x.x.x-setup.exe 的程序,并安装。安装时选择配置 Subversion 模块。 3. 创建基本验证所用的用户文件 在 C:\Program Files\Apache Group\Apache2\bin 目录下,执行: htpasswd -c svn.passwd <username> 然后根据提示输入密码,svn.passwd 这个用户文件就建立好了,把它复制到 conf 目录(不是必须复制,只要在配置文件中填写正确的路径就行了)。 4. 配置 httpd.conf 第 2 步完成后,Subversion 服务应该就已经运行起来了,不过有些地方还需要配置一下。打开 httpd.conf,你会发现刚才运行的安装程序在最后一行 LoadModule 语句后添加了如下语句: LoadModule dav_module modules/mod_dav.so 我曾试图按照一些指南上说的,把 C:/Program Files/Subversion/bin 里的文件复制到 Apache 的 modules 目录里,并把 http.conf 里的路径也改成相对路径。但发现这样 Apache 总是运行不起来(即使把某些手册中提到的 libdb42.dll 和 libeay32.dll 文件也复制过来),出现 "The requested operation has failed!" 的提示。所以现在还是使用安装程序所添加的绝对路径。 接下来添加 Subversion 的配置部分,将以下语句追加到 http.conf: <Location /svn> 至此,Subversion 服务就配置好了。 6/25/2006 文件最优分配算法这个功能是 WUSN 2 中的,三月份就写好了,现在把它整理出来,以便参考。 算法本身很简单,但经过实际使用,发现分配结果还是很理想的。
6/7/2006 文件校验工具 —— wxChecksums今天需要找一个文件校验工具来用,搜索了一下,FlashSFV 的结果较多,但看了一下截图,觉得有些简陋。 接着便像往常一样在 sf.net 查找,还真找到了一个满意的,就是 wxChecksums。这个软件有 Windows 和 Linux 两个版本,选项设置也很丰富,甚至连目录分隔符和换行风格都能指定。 主页 (英文版): http://wxchecksums.sourceforge.net/mainpage_en.html 6/3/2006 说一下我对现在流行的音频编码格式的看法无损 FLAC: 制作无损音乐我觉得 FLAC 格式最好,无论是压缩还是解压,速度都比 APE 快不少。 APE: 目前比较流行,且相应的工具比较多。 有损 MP3: 中高码率时表现较好,适合压缩歌曲、音乐等声音。个人偏好使用 128 - 192kbps VBR 的质量压缩一般歌曲,192 - 256kbps VBR 的质量压缩音乐和好的歌曲。 WMA: 低码率时表现很好,适合压缩评书、相声等声音。个人偏好使用 20kbps 16kHz stereo 或 32kbps 22kHz stereo 的质量。注:Codec 使用 WMA9STD,而非 WMSP9。Voice 的编码质量限制较多,且不是所有能放 WMA 的设备都支持 Voice 编码。 OGG: 不推荐使用。感觉压缩出来的音频回放时有高频金属声。 5/30/2006 Windows Media Player 115/29/2006 抑郁倾向?在网上看到的,抑郁倾向的 9 个特征:
黑色的项目在我身上都有不同程度的体现(较为明显)。 5/20/2006 PHP 5.1.4 气死我了前一段时间我的 Files 中有一些应用程序产生了异常,比如 Media Player 中某些音乐的歌词加载不正常,Highlighter 中看不到文件内容。我一直以为这是网络问题引起的,比如主机名解析错误,或者是被安装了间谍软件,就朝着这个方向查找问题,但一直没找到问题。 今天经过一阵忙活,最后发现这个问题居然是 PHP 5.1.4 引起的,降低到 5.1.2 版后一切正常。 PS,5 月 1 日 PHP Group 就发布了 5.1.3 版,没过几天又发布了 5.1.4 版来修正 5.1.3 版中的一个紧要的错误,后来不知哪天又说上次 PEAR 的 phar 文件没有打包进去,又更新了一次。 5/4/2006 模式识别 之 分类器这两天在学习模式识别中的分类方法,由于知识有限,很多内容看不懂。 前两天做了一个简单的基于贝叶斯决策理论的分类器。在应用合并概率公式时发现一个问题,如果一个样本中有一个词在第一类中出现的概率为1,还有一个词在第一类中出现的概率为0(或者说在第二类中出现的概率为1),这时最终就会出现0除以0的问题,这是我不愿意看到的。还有,只要有一个词在某一类中的概率为1或0,最终概率就会等于1或0,这也是我不愿意看到的。为了解决这个问题,对于在某一类中出现的概率为1或0的词,我把这个概率改为0.999999或0.000001这样接近于1或0的数字。最终测试结果还是比较令人满意的,分得八九不离十。 今天下午看到了一篇论文,里面提到了 Winnow 这个线性分类算法。看了半天没怎么看懂,里面的向量 x = (x1, x2, ..., xn) 表示待分类的文本实例,然后这个 x 向量还要和权重向量 w = (w1, w2, ..., wn) 点乘。这样看来 x 向量里的每个坐标应该都是数字,但是分类时提取出来的都是词,进行到这块就不知道该怎么处理了。不过中科院早已经把这个方法应用到垃圾邮件识别上了,据说效果比贝叶斯的要好一些。 5/3/2006 Hollywood East Star Trax昨天开始下载 VeryCD 的 wdfdf 提供的 荷东十个专辑及二个串烧专辑。 看论坛里的帖子发现第 2, 3 集由于盘片损伤,有 7-8 首歌受到影响了。但是,aecom 在回复中给出了荷东 BT 版本种子的下载页面。我看了一下,里面的文件大小与 VeryCD 提供的都不相同。但 BT 版本的有些专辑是分开的 WAV 文件,所以怀疑那个版本是拼凑的。而 VeryCD 的都是 wdfdf 自己亲手抓取的。所以打算主要从 VeryCD 下载,有问题的专辑下载 BT 版本的,毕竟听着听着来个几秒钟的静音还是非常不爽的。 PS,该资源已发布: Various Artist -《荷东》(Hollywood East Star Trax)[MP3!]。 Miranda IM Database Reader 项目地址3/31/2006 Miranda IM Database Reader 已提交MIM DB Reader 是一个可以读取 Miranda IM 数据库的 PHP 类。因此你可以获得联系人设置、聊天记录等有用的信息。 ---- 这次除了 PHP Classes,还提交到了 SourceForge.net。 sf.net 的应该能先批下来,PHP Classes 的可能需要较长的时间才能批完。 3/23/2006 系统各组件简介Commons Commons 是系统的中心,实现一些多个程序都会用到的功能,也起到一定的沟通作用。 现在 Commons 的功能较少。仅含有通用文件访问和相关资源查询及处理。
Contacts Contacts 用于管理联系人信息。其中的所有联系人的姓名都会被用做相关资源里的关键词。 联系人的所有信息均用序列化的关联数组存储,因此信息组织比较自由。 Contacts 支持联系人照片存储,照片的数据存储在 Files 中。 导入程序手机导出的联系人时,处理联系人的照片。导出程序则支持多种格式,完全按照自己的习惯导出,例如为手机导出的联系人的名称可以选择使用“职务,姓名”的格式。 另外,带有生日的联系人的 ID 及生日会提供给 Events,供生日提醒使用。
Events Events 用于记录各种事件。包括已发生的,将要发生的,固定时间发生的,可能会发生的。 已发生事件主要作回顾用,也可为未来发生的事作一些参考。 将要发生的事件用来作日程安排。 固定时间发生的事件用来作提醒,比如提醒某人哪天过生日。 可能会发生的事件,则是自己的一些猜测,待日期到后看猜测是否准确,纯属消遣。
Files Files 用于管理文件。它支持虚拟目录(即直接访问 Web 服务器的磁盘)。 照片,文档,音乐,代码等文件均放置其中。各种应用程序可妥善管理。 例如针对照片有在线注释程序,针对音乐有支持歌词同步的播放器。
Resources Resources 用于查找与处理网络资源。现在可从一些门户网站查找电影、电视及音乐的更新信息。 这样就可以不用关心电影、音乐的相关消息,让程序去发现。自己要做的只是选择对这个资源的处理方式。
Search Search 用于搜索本地硬盘内的文件,以及系统中的各种信息。
WUSN WUSN 用于编号与管理资源。 写一下我的系统的构成写一下我的系统的构成,也方便自己看。 整个系统的主旨是 记录与享受 (Record & Enjoy)。包含如下组件: Commons —— 系统中心 Contacts —— 联系人管理 Events —— 事件记录 Files —— 文件管理 Resources —— 网络资源查找与处理 Search —— 信息搜索 WUSN —— 资源编号与管理 以及如下 PHP Class: Fast Chinese Word Segmentation —— 快速中文分词,用于 Search,目的是避免一些交叉歧异 Gender Guesser —— 性别猜测,用于 Contacts,目的是导入联系人信息时自动补充性别信息 Specified Strings Picker —— 指定字符串提取,用于 Commons,目的是提取文本中的名人姓名 2/17/2006 接下来...接下来主要有三个工作要做: 1. 相关项目查找。为资料编制索引,以便在必要时查找相关项目。 2. 可识别人名的中文分词。实际应用时,能不能识别人名对相关项目查找的效果有很大影响。现在打算在 Fast Chinese Word Segmentation 中增加一个方法,允许用户添加词条(主要为了姓名识别,来添加已知人名)。而对于 MP Chinese Word Segmentation,则需要在词库中增加姓氏、姓名的概率,来识别人名。 3. 图片注释工具。这是一个用 XML 存储数据的,JavaScript 控制客户端编辑的,利用 VML 或 SVG 显示注释的一个工具。 |
|
|