Sybase数据库技术，数据库恢复专家

存档

2010年12月20日的存档,文章数:1

Sybae ASE中支持简体中文的字符集

　　目前在ASE 15中支持简体中文字符的字符集有四种：CP936，EUCGB，UTF-8和GB18030。

　　其中EUCGB字符集是基于GB2312-80编码规范的，它的EUC (Extended Unix Code)编码范围是第一字节0xA1~0xFE(实际只用到0xF7)，第二字节0xA1~0xFE。

　　CP936字符集是基于GBK编码规范（实际上的国家标准是GB13000-90），是对GB2312进行的扩展，第一字节为0x81~0xFE，第二字节分两部分，一是0x40~0x7E，二是0x80~0xFE。其中和GB2312相同的区域，字完全相同。

　　GB18030字符集（国家标准号是GB18030-2000）是2000年3月17日发布的新的中文编码标准。它是GB2312的扩充，采用单/双 /四字节编码体系结构，收录了27000多个汉字以及臧文、蒙文、维吾尔文等主要的少数民族文字。Sybase 从ASE 12.5.0.3之后开始支持 GB18030字符集。

　　UTF-8字符集是现有ASCII系统向Unicode转换的一个过渡方案。它使用1-3字节表示一个字符。简体中文的每个字符在utf8中的长度基本上都是3个字节。它的最主要的优点是可以同时支持超过650种语言的字符。缺点是针对中文字符来说，需要增加50%的空间用来存储。还有一个问题是执行sp_helptext显示存储过程体的时候，有可能出现半个汉字。

　　一般来说，由于 EUCGB不支持国标一、二级字库以外的汉字，所以我们推荐用户在服务器端和客户端都使用CP936字符集，或者在ASE 12.5.0.3之后还可以使用GB18030字符集，它可以支持一些比较生僻的汉字。它的不足是只有一种排序方式，即区分大小写的Binary方式。所以，如果需要使用支持中文字符集且不区分大小写的数据库时，就只能使用UTF-8作为服务器端字符集，而客户端使用CP936或GB18030字符集。
　　eucgb、cp836、gb18030仅支持区分大小写的排序顺序，utf-8支持不区分大小写的排序。

阅读全文…

标签: ASE, 字符集

第 1 页，共 1 页1

© 2009-2021 Sybase数据库技术，数据库恢复专家 - 提供Sybase ASE及Sybase SQL Anywhere数据库修复服务，电话：13811580958(微信)，QQ：289965371！We have many years of experience in recovering data from damanged Sybase devices. Contact us by Phone: +86 13811580958 Wechat: 13811580958 Email: 289965371@qq.com｜京ICP备2020043699号-2
Powered by WordPress | Theme by NeoEase | Valid XHTML 1.1 and CSS 3
SiteMap | Baidu Knows | Google Knows | About

存档

Sybae ASE中支持简体中文的字符集

Sybase数据库修复服务

分类目录

最新文章

标签

热文排行

Linux-Links

Sites

SYBASE-Links

文章归档

Meta

Sybase数据库技术咨询