跳至内容
朝复暮

朝复暮

  • 首页
  • Linux
    • latex
    • lisp
    • perl
    • php
    • python
    • vim
    • javascript
  • emacs
  • 图形
  • R语言
  • 数学
  • 链接

分类:中文处理

发布于2012 年 07 月 29 日2016 年 02 月 27 日 -- 点击:2,383次

Unicode 和 ISO 10646

ISO 和 Unicode 组织在大约80年代末,各自独立的推出了各语言的全球统一编码标准,但是在推出不久,他 …

继续阅读“Unicode 和 ISO 10646”

发布于2012 年 07 月 29 日2016 年 02 月 27 日 -- 点击:2,144次

php 支持的编码格式

mb_list_encodings()的输出,我的php版本是 PHP 5.3.2-1 Array ( [0] …

继续阅读“php 支持的编码格式”

发布于2012 年 07 月 29 日2016 年 02 月 27 日 -- 点击:3,817次

GB2312/GBK/GB18030 和汉字的Unicode编码

GB2312-1980 是中国1981年公布的,包含7,445个字符,其中6,763个汉字和682个非汉字字符 …

继续阅读“GB2312/GBK/GB18030 和汉字的Unicode编码”

发布于2012 年 07 月 28 日2016 年 02 月 25 日 -- 点击:1,866次

处理中文的脚本

在处理中文的过程中,中文编码是一件很头疼的事情,经常会出现这样那样的问题。这里有一个通用的解决方案。 1. 确 …

继续阅读“处理中文的脚本”

发布于2012 年 07 月 27 日2016 年 02 月 27 日 -- 点击:1,774次

关于网络文章的收集

一直想收集一些网络上的小说文章,可以让自己很方便的查询。或者另外一个很有说服力的理由就是,有这些东西,可以以自 …

继续阅读“关于网络文章的收集”

发布于2012 年 04 月 20 日2016 年 02 月 27 日 -- 点击:1,664次

中文分词项目(python)

http://code.google.com/p/pymmseg/  有download , 有字典, 可运行 …

继续阅读“中文分词项目(python)”

文章导航

上一页 页 1 页 2

功能

  • 注册
  • 登录
  • 文章RSS
  • 评论RSS
  • WordPress.org

近期评论

  • Chen发表在《rstatscn, 国家数据库的R接口》
  • Lisha Dong发表在《R 电子书籍整理》
  • iherb发表在《健康饮食–芹菜胡萝卜汁》
  • data猫咪发表在《rstatscn, 国家数据库的R接口》
  • data猫咪发表在《rstatscn, 国家数据库的R接口》

分类目录

  • android (17)
  • C/C++ (62)
  • CSS (10)
  • CUDA (4)
  • drupal (19)
  • emacs (40)
  • firefox (22)
  • gdb (12)
  • golang (1)
  • hadoop (25)
  • java (1)
  • javascript (10)
  • latex (8)
  • Linux (148)
  • lisp (16)
  • markdown (15)
  • pdf (4)
  • perl (11)
  • php (13)
  • python (26)
  • ruby (41)
  • R语言 (70)
  • VBA (1)
  • vim (23)
  • windows (21)
  • wordpress (43)
  • 中文处理 (26)
  • 人工智能 (8)
  • 其他备忘 (1)
  • 化工 (45)
  • 反编译 (4)
  • 图形 (24)
  • 应用开发 (24)
  • 投资 (5)
  • 搜索引擎 (19)
  • 数学 (16)
  • 数据挖掘 (20)
  • 数码电子 (8)
  • 新站介绍 (1)
  • 旅游地理 (5)
  • 未分类 (31)
  • 杂谈杂感 (12)
  • 照片 (2)
  • 生化 (2)
  • 生活 (22)
  • 电力 (3)
  • 算法 (1)
  • 经济 (2)
  • 网站动态 (27)
  • 网络 (26)
  • 美食 (21)
  • 考古 (2)
  • 股票 (27)
  • 视频 (9)
  • 设计 (1)
  • 语言参考 (3)
  • 量化交易 (9)
  • 金属 (1)
跟我联系 jianghang at bagualu.net