第2页 - 关于unicode的讨论汇总 - 话题女王

全部话题 - 话题: unicode

z*******n
发帖数: 1034

来自主题: MobileDevelopment版 - Introduction to "The Java Language Specification, Java SE 8 Edition

http://www.informit.com/articles/printerfriendly/2211695
Introduction to "The Java Language Specification, Java SE 8 Edition"
By James Gosling, Gilad Bracha, Alex Buckley, Bill Joy, Guy L. Steele
Date: Jun 12, 2014
The Java® programming language is a general-purpose, concurrent, class-
based, object-oriented language. It is designed to be simple enough that
many programmers can achieve fluency in the language. The Java programming
language is related to C and C++ but is organized rather dif... 阅读全帖

s********u
发帖数: 1109

来自主题: JobHunting版 - Google第二轮电面

好像是一个unicode对应多个char。而且比如ab是一个unicode，cd是一个unicode，但
是abcd也可能是一个unicode，所以他一直在跟我解释怎么标记这些。但肯定有办法区
分的，否则就不是唯一了，那还怎么表示字符啊，又不是word break问题。应该多由我
来问
的，这些更清楚些。
最后也不知道是不是到底这意思。

s********u
发帖数: 1109

来自主题: JobHunting版 - Google第二轮电面

B********4
发帖数: 7156

来自主题: Joke版 - 一个测试工程师走进一家酒吧

在Visual Studio中的Debug模式下，如果声明一个变量，但是没有初始化，微软会给未
初始化的内存复制为0xCC。给为初始化的内存赋0xCC是有原因的，0xCC其实是INT3中断
指令，所以如果在Debug模式下试图去执行这块未初始化的内存的话就会中断程序。但
VS中调试器默认的字符集是MBCS，而在MBCS中0xCCCC正好就是中文中“烫”，所以显示
出来就都是烫……
锟斤拷则涉及unicode的字符集转换问题，Unicode和老编码体系的转化过程中，肯定有
一些字，用Unicode是没法表示的，Unicode官方用了一个占位符来表示这些文字，这就
是：U+FFFD REPLACEMENT CHARACTER。U+FFFD的UTF-8编码是0xEFBFBD，如果重复多次
形成：EFBFBDEFBFBDEFBFBD 这样在GBK/CP936/GB2312/GB18030的环境（都是中国标准
惹的祸）中显示的话，一个汉字2个字节，最终的结果就是：锟斤拷——锟(0xEFBF)，
斤（0xBDEF），拷（0xBFBD）……

X****r
发帖数: 3557

来自主题: Programming版 - 顺便问一个CreateFile问题 (转载)

这个和CreateFile没什么关系，你要在UTF-16和UTF-8之间进行转换的话用
wcstombs/mbstowcs这些函数。
见 http://msdn.microsoft.com/en-us/library/6y9se58z(VS.71).aspx
另外，你如果用printf/wprintf系列函数写文件的话，可以用%S而不是通常的%s来表明
你传进去的字符串是另一种encoding。
见 http://msdn.microsoft.com/en-us/library/hf4y5e3w.aspx
顺便说一下，Unicode是指Character Set，UTF-16和UTF-8都是Unicode的一种encoding。
只是在VS里经常就把UTF-16称作Unicode。

unicode

c******n
发帖数: 4965

来自主题: Programming版 - sucks (转载)

unicode code point value can go larger than 65535
anyway that book made a conceptual error : it's meaningless to talk about
the "length" of unicode, unicode is just a number, when we talk about length
, it's always the *encoded* length under a charset.
java char can only represent the BMP and surrogate part of unicode, that's
what the book should say

g********d
发帖数: 19244

来自主题: Automobile版 - [合集] RE: 奔驰质量很令人担忧

☆─────────────────────────────────────☆
iMaJia (iMac,iPod,iPad,i馬甲) 于 (Mon May 6 17:04:13 2013, 美东) 提到:
6个月前买的 2013 MB C350. 前侧一个或多个喇叭间歇性没声音. 挡风玻璃水刮运行不
流畅, 一顿一顿的. 而且雨水探测器有时发疯. 昨天微微小雨，停在红灯前, 忽然水刮
以最大速度狂刮不止. 关了重开才正常
这是都TNND的什么质量
Update:
上个月跑了3次dealer, 换了左侧扬声器. 上星期发现右侧扬声器也有同样的问题, 也
是随机没有声音. 开始怀疑这不是音箱的问题，是立体声机单元问题. 今天左侧扬声器
又没有声音了.
其它不满意:
- 还有, 用microSD卡放MP3, 有时一开车就马上可以听, 有时刚停5分钟, 打火后车要
"reading from memory card" 一段时间才能听. 这又是什么原理...
- 有时 bluetooth 语音命令电话拨号, 语音回复 "that command is not available
n... 阅读全帖

v***a
发帖数: 365

来自主题: JobHunting版 - Google实习第一轮电话面试总结

冲突
多谢分享！比atoi有意思多了。。。。
感觉32位Unicode字符统计BST或许会好点。
分布的情况貌似可以这样：
1）所有机器的Top 1% freqent unicodes. 得到这些集合的交集 X。
2）如果 X 是空集，扩展到2%，重做，直到X不是空集。
3）频率最高的在 X 中，统计X中所有unicodes的频率，取最高
肯定code不出来了，涉及到了BST, Heap, Hash, Disjoint Set and splay tree.
而且最坏情况还是传输了所有机器的 BST……比 hash 还糟糕点，呵呵
攒点字数，RP守恒！

d*b
发帖数: 21830

来自主题: shopping版 - windows 7 ultimate版是不是可以直接选择中文系统？

早说了，国内很多软件的中文界面不是unicode的，是GB18030的。如果你不明白为什么
不用unicode,自己看信息产业部的公文吧。同样道理，为什么中文版的windows是GB码
而不是unicode. 英文版的windows不native支持中文GB码，为什么总有那么多自做聪明
的人jjww这jjww那呢？

k***e
发帖数: 7933

来自主题: shopping版 - 问个中文显示的问题

【以下文字转载自 Software 讨论区】
发信人: kanke (回家), 信区: Software
标题: 问个中文显示的问题
发信站: BBS 未名空间站 (Thu Oct 21 00:17:29 2010, 美东)
winxp，安装了中文包，non-unicode default选了中文，安装了搜狗输入法。在dos
window里面可以激活搜狗输入法，也可以显示中文。
win7 x86，安装了中文包，non-unicode default选了中文，安装了搜狗输入法。但是
在dos window里面不能激活搜狗输入法，也不能显示中文。上网可以看中文，中文的软
件运行也可以显示中文。
请问怎么才能在win7的dos window里显示中文？？
最初的问题是我安装了subversion for windows（http://sourceforge.net/projects/win32svn/），都是一些command line，而且这些command的输出都是中文的（是不是因为我non-unicode default选了中文的原因？），这个在winxp上没有问题，但是在wi... 阅读全帖

s**********9
发帖数: 1238

来自主题: LosAngeles版 - 用WIN 7的筒子请进，有问题请教

恩，似乎可行。。。
目前放狗的结果是HOME PREMIUM上运行UNICODE 中文软件是没问题的，NONE-UNICODE出
现乱码，还有某些字幕也会乱码。
如果在REGION里把NONE-UNICODE 区域改中国似乎可以解决这个问题吧

f******s
发帖数: 541

来自主题: WaterWorld版 - USB和舟子的旧事 (兼论舟子的“子”) 解滨本来都已经说好了不再谈方舟子的文坛旧事了，但上个星期发生的那起USB事件让俺想起了17年前发生的一件网络上的大事。俺要是不把那件事说出

USB和舟子的旧事
(兼论舟子的“子”)
解滨
本来都已经说好了不再谈方舟子的文坛旧事了，但上个星期发生的那起USB事件让俺想
起了17年前发生的一件网络上的大事。俺要是不把那件事说出来，不但对不起网上的
老少爷们，也对不起历史。所以俺破例再写一集，就算是集外集吧。
上星期，新片《黄金大劫案》的主创到上海复旦大学松江校区会学子。导演宁浩弄来大
牌英语培训专家罗永浩坐镇，更请到青春偶像韩寒压轴登场，场面火爆。韩寒念念不忘
拿对头方舟子开涮：“在人生当中有很多不如意事情，有很多的人在背后诋毁你。但我
只有一句话，路边几条臭水沟，不及江河万古流。” 现场的最高潮，还是韩寒和罗永
浩对方舟子的调侃。宁浩现场送二人每人一个“金砖U盘”。罗永浩接过金砖U盘后，
立马声明，“我在方舟子出来说之前说，这是假的金砖。” 主持人让二位送给方舟子
一句话，韩寒毫不犹豫地说，“这是个USB吧，我想对他说三个字：U，SB！”
这话让MM们当场笑翻。看来韩寒未必是完全不学无术，但他脑瓜子有点歪，却歪而不
邪。方舟子看了后会怎么想？这个连俺都知道：
1. 韩寒，一个只会泡妞的赛车司机，一个体育生，文章靠... 阅读全帖

M*P
发帖数: 6456

来自主题: Joke版 - Re: 280 锟斤拷锟斤拷锟斤拷锟剿凤拷锟斤拷 (转锟斤拷) (转载)

Unicode和老编码体系的转化过程中，肯定有一些字，用Unicode是没法表示的，
Unicode官方用了一个占位符来表示这些文字，这就是：U+FFFD REPLACEMENT
CHARACTER。
那么U+FFFD的UTF-8编码出来，恰好是 'xefxbfxbd'。如果这个'xefxbfxbd'，重复多次
，例如 'xefxbfxbdxefxbfxbd'，然后放到GBK/CP936/GB2312/GB18030的环境中显示的
话，一个汉字2个字节，最终的结果就是：锟斤拷——锟(0xEFBF)，斤（0xBDEF），拷
（0xBFBD）

【以下文字转载自 TVGame 讨论区】

H********g
发帖数: 43926

来自主题: Joke版 - 关于回帖乱码的问题

我今天刚研究了一下unicode 原来由于历史原因windows里常用的是utf16 或者gbk

要分辨少量2字节的utf16汉字和同样2字节的gb汉字可能比较困难所以造成目前这种
回复里有两种编码的情况
现在看起来所有的东西都在往unicode转变所以gbk迟早是要被淘汰的毕竟它只是
一种地方编码只有写简体汉字才方便
unicode里 utf16和ascii不是兼容的但utf8和ascii是完全兼容的因此用utf8
的网页文件可以只包含单一编码处理起来比含有gb或者utf16的网页可能简单一些
utf8里一个汉字3字节而不是两个 gb和大部分常用utf16汉字是2字节但这个代
价其实很小尤其考虑到网页本身的代码（数量可能比汉字内容多许多）都是ascii 在
utf8里只有一个字节用utf8的网页跟用gbk的比只是汉字部分大了一半
所以结论是如果彻底转成utf8 可以完全解决乱码问题

l**n
发帖数: 7272

来自主题: Apple版 - Unix的缺陷(ZT)

虽然这里的码工比较少，但是能appreciate coding和programming的朋友也可以看看。
我觉得挺有意思的。
http://blog.sina.com.cn/s/blog_5d90e82f01014k5j.html
我想通过这篇文章解释一下我对 Unix 哲学本质的理解。我虽然指出 Unix 的一个设计
问题，但目的并不是打击人们对 Unix 的兴趣。虽然 Unix 在基础概念上有一个挺严重
的问题，但是经过多年的发展之后，这个问题恐怕已经被各种别的因素所弥补（比如大
量的人力）。但是如果开始正视这个问题，我们也许就可以缓慢的改善系统的结构，从
而使得它用起来更加高效，方便和安全，那又未尝不可。同时也希望这里对 Unix 命令
本质的阐述能帮助人迅速的掌握 Unix，灵活的应用它的潜力，避免它的缺点。
通常所说的“Unix哲学”包括以下三条原则[Mcllroy]：
一个程序只做一件事情，并且把它做好。
程序之间能够协同工作。
程序处理文本流，因为它是一个通用的接口。
这三条原则当中，前两条其实早于 Unix 就已经存在，它们描述的其实是程序设计最... 阅读全帖

s*****y
发帖数: 3

来自主题: CS版 - 用libxml2 API open xml file的问题

我用libxml2 parser.h 中的 xmlReadFile 打开一个xml file
xmlReadFile 的 parameter -> const char *URL 不支持 wchar，所以当xml file的
path 是 Unicode时，需要用WideCharToMultiByte转化。但是如果Unicode的path有
非英文字符时，这也方法就行不通了。
有没有什么方法可用libxml2 的api，open unicode path的 xml file呢？
谢谢！

d****n
发帖数: 5

来自主题: Java版 - 急问：java如何处理中文字符

(1)Java works internally with Unicode, so when compiling source code files
that used a Chinese encoding such as Big5 or GB2312, you need to specify the
encoding to the compiler in order to properly convert it to Unicode.
javac -encoding big5 sourcefile.java
or
javac -encoding gb2312 sourcefile.java
(2)If you read chinese chars from a file or database, most likely it is gb2312
or big5 encoding, then you have to map them to Unicode.

l***s
发帖数: 28

来自主题: Java版 - [转载] 有人在用NetBeans IDE么？

【以下文字转载自 Programming 讨论区】
【原文由 Links 所发表】
我下载java J2SE的时候，选择了下载boudle with NetBeans IDE。结果
这个家伙， sigh, 一言难尽啊。我的机器是英文版windows XP。为了让
terminal 可以显示中文，我就在language setting里边选择了， non-unicode
的program, 使用default 中文。这个选择对unicode 的软件没有影响。
可是没想到这个NetBeans居然是个随风倒的家伙。当我开启的时候，它就
自动默认我的系统语言是Chinese, 所以软件成了中文版本。看起来别扭级了。
然后我turn off language setting 中non-unicode program default lang - Chinese
以后呢，再启动netbeans，他就变成英文版奔了。可是turn off 以后，
存中文软件就不能显示中文窗口了。 telnet也不能看中文了。：（而且
switch on and off每次需要重新启

w****g
发帖数: 597

来自主题: Java版 - 如何去掉编译Java代码的汉字提示，回到英文提示

谢谢goodbug的及时答复.
我已经按照你的建议在Reginal and Language Options中,设置了:
1) In Reginal option Tab, set "Location" to US, and,
2) In Advanced Tab, set "Language for non-unicode programs" to Chinese.
then, I restart WinXP, let new setup take effect.
结果，编译Java代码的文字提示还是汉字，而不是英文文字提示. 我上面的步骤1与2理
解是正确无误吗?
我自己再一次试验设置了: 1)set Location to US; 2)Language for non-unicode to
English,结果,编译Java代码的文字提示变成了乱码,既不是英文也不是汉字.只好又恢
复成: 1)location=US; 2)Language for non-unicode=Chinese. 结果, 编译Java代码
的提示文字也恢复为汉字了, 问题还是没有得到解决. 难道只有把英文

z***e
发帖数: 5393

来自主题: Programming版 - 顺便问一个CreateFile问题 (转载)

【以下文字转载自 Seattle 讨论区】
发信人: zlike (最终幻想), 信区: Seattle
标题: 顺便问一个CreateFile问题
发信站: BBS 未名空间站 (Sat Jun 7 04:04:00 2008)
Visual Studio里面缺省是Unicode.
随便const TCHAR *s=_TEXT("asdfsdfsdfsddfsdfsddfdsfsdf");
然后CreateFile(),WriteFile(....)....
那个出来的text文件始终是Unicode的，如果改project configuration,改成unset的话
就是ANSI，问题是我要UTF-8的，怎么生成啊？
之所以要UTF-8，是因为生成的是一个xml，然后另外一个C#的程序去读，如果unicode
的话那个C#里面的那个XMLxxxx就要发神经报错，ANSI就没问题。

s*****y
发帖数: 3

来自主题: Software版 - 用libxml2 API open xml file的问题

k***e
发帖数: 7933

来自主题: Software版 - 问个中文显示的问题

winxp，安装了中文包，non-unicode default选了中文，安装了搜狗输入法。在dos
window里面可以激活搜狗输入法，也可以显示中文。
win7 x86，安装了中文包，non-unicode default选了中文，安装了搜狗输入法。但是
在dos window里面不能激活搜狗输入法，也不能显示中文。上网可以看中文，中文的软
件运行也可以显示中文。
请问怎么才能在win7的dos window里显示中文？？
最初的问题是我安装了subversion for windows（http://sourceforge.net/projects/win32svn/），都是一些command line，而且这些command的输出都是中文的（是不是因为我non-unicode default选了中文的原因？），这个在winxp上没有问题，但是在win7上就都是乱码了。有人知道怎么才能让这个subversion for windows command的输出时英文？
谢谢

s*****y
发帖数: 3

来自主题: XML版 - 用libxml2 API open xml file的问题

x*******u
发帖数: 500

来自主题: Statistics版 - help! 读CSV文件读得要崩溃了

谢谢大家的帮助，最后是SAS Technical Support 解决了问题。
It looks like you may have a Unicode file that has a hex '00' between each
character. Are you using PROC IMPORT to read the file? Use a FILENAME
statement to create a fileref for the file you want to read. On the
FILENAME statement add the ENCODING=UNICODE option. Then in the PROC IMPORT
, use DATAFILE=.
For example,
filename temp 'c:\temp\qualityinfo.csv' encoding="unicode" lrecl=32767;
proc import datafile=temp out=quality dbms=csv ... 阅读全帖

c***s
发帖数: 70028

来自主题: Headline版 - 2017上半年朋友圈十大谣言，你中招了吗？

一眨眼，2017已过去一半。这期间，“谣言”还是时常出现。而且还多了一种新的常见传播形式，就是用视频来传谣。
今天，小编就整理出了这半年中的十大朋友圈谣言，一起来看看吧。
朋友圈十大谣言
1、肉松面包上的肉松是棉花做的
谣言类别：失实报道
欺骗指数：★★★★★
危害指数：★★★★
谣言内容：
5月下旬，多段浸泡肉松面包上的肉松视频在网上流传，拍摄者来自不同地区，但内容基本一致：买来肉松面包或糕点后，将上面的肉松泡入水中，肉松在水中变成白色絮状物体，拍摄者声称这些肉松其实是棉花做的，并用白色絮状物可用打火机点燃作为证明。
真相：
国家食药监局的官方微信平台“中国食事药闻”对“肉松饼包棉花”这类视频进行了辟谣：肉松和棉花二者成分不同，口感也存在很大差异，用棉花冒充肉松几乎不可能。
肉松的本质是肌肉纤维，主要成分为蛋白质，放入嘴里一咬就会融化，口感松软。而棉花的本质是植物纤维，主要成分为纤维素，是一种不可溶的纤维，虽然看上去也很松软，但嚼不烂。也就是说，真用棉花冒充肉松，一吃就会被识破。
相关专家还指出，视频中所使用的“火烧”鉴别法看似科学，其实也不靠谱。食物可以被点燃是一种普遍现象，因为... 阅读全帖

i****a
发帖数: 36252

来自主题: Automobile版 - 车音响可以 rip CD，挺方便的

我刚研究明白了. MP3 的 tag 要用 ID3 unicode encoding. 我用windows media
player internet album info 自动生成的tag是 big5 encoding, 车方是显乱码. 用
tag convertor （网上 freeware) 换成 unicode 就可以显示了.

[发表自未名空间手机版 - m.mitbbs.com]

u*********r
发帖数: 176

来自主题: Automobile版 - 小谈BMW 5系F10平台，328是钓丝渣渣车(更新几张HUD)

然后是音乐界面，这个播放器支持Unicode, 只要MP3文件的IDv3 tag是用unicode编码
的，就能显示，而且封面图也能显示

g********d
发帖数: 19244

来自主题: Automobile版 - [合集] 小谈BMW 5系F10平台，328是钓丝渣渣车(更新几张HUD)

☆─────────────────────────────────────☆
uninstaller (卸载程序) 于 (Fri Apr 5 17:27:44 2013, 美东) 提到:
不熟悉F平台的先看看Wiki,
http://en.wikipedia.org/wiki/BMW_5_Series_(F10)#BMW_5_Series_Se
简单的说就是7系底盘，跟F01共享
外观神马的我先略过，网上搜图一大票，不过内部我重点介绍下，
我对BMW的5系细节非常满意
具体有几个，首先是快捷方式的按键是带触感的，如果手放上去了，屏幕会出现快捷方
式菜单
☆─────────────────────────────────────☆
uninstaller (卸载程序) 于 (Fri Apr 5 17:32:37 2013, 美东) 提到:
貌似占楼不好发图，就这样吧
内饰的细节设计，
这个发光的条我灰常喜欢，晚上十分好看，而且可以照明一些按钮，亮度可以，不刺眼睛
☆─────────────────────────────────────☆
uninst... 阅读全帖

i****a
发帖数: 36252

来自主题: Automobile版 - 我的小奔又光荣入厂了

是不是要转成 unicode. 我用unicode rewriter. 简单，绿色，免费

[发表自未名空间手机版 - m.mitbbs.com]

f****o
发帖数: 4067

来自主题: Automobile版 - 有没有开toyota,lexus的. 紧急咨询

我也有Honda系统的. 如果是gb/big5,显示乱码. 转成unicode后正常显示.
lexus完全不显示. 播放没问题. 歌曲名,歌手显示一个横杠"-". 英文没有问题. 如果
unicode都不显示,够落后的. 别人买车也注意了,想显示中文歌名的话,toyota
infotainment 就是不行.

k**o
发帖数: 15334

来自主题: Automobile版 - Toyota 车其实不是日车是美车

CJK是share的unicode block，支持日文必然也要支持中文和韩文。除非
现在还有奇葩系统不用 unicode.

k******u
发帖数: 3137

来自主题: ChinaStock版 - 交流一下用什么网站/软件看国内股市

你知道的错了, 不是unicode, 是改non-unicode 成中文

o******e
发帖数: 81

来自主题: JobHunting版 - Amazon电面面经

btw这个是俺的马甲
今天第一轮电面，我是experienced的不是fresh
感觉不怎么好，就问了一道题，太多detail了
电话来迟了8分钟，加拿大人。先问了问最challenge/favorite的project，说了几分钟
后他说我知道了，考你个题吧
很简单，Unicode的charactor array/string，找出现次数最多的char
我给了3个解，基本没有用任何考虑时间
1. double loop, O(n^2)
2. hash，他问我worse case，我一不留神说了O(n)，忘了hash的陷阱。他说恩perfect
hashing是不存在的，blablabla，我说我完全同意。我说如果space足够的话效率比较
好的char hashing是不太难的，他说anyway那也是O(n)，好吧。。
3. int[65536]的array，因为是unicode，我跟他确认了一下是2 bytes。我一开始说复
杂度的时候原来的solution是iterate string一遍，然后iterator count的array一遍
，突然想到可以用一个temp varia... 阅读全帖

l****p
发帖数: 397

来自主题: JobHunting版 - Google实习第一轮电话面试总结

两通电话，每个45min，到最后两个都超时
第一通电话：
１、指定我简历中的一篇一作文章，让我描述那文章里的内容
２、如何从一个只含有ASCII字符的字符串中找出最频繁的字符
我说用哈希表记录每个字符出现次数，然后他又补充问到哈希表是怎么工作的，我说包
括哈希函数和冲突处理两部分，并简述了一下，说由于字符不太多，可以用链表处理冲突
３、如果这个字符串含有32位Unicode字符的串，如何修改之前的算法
我说为了节省空间，可以把冲突处理方式改成rehashing
４、如果一个同事提出用一个array来记录各个字符的次数，比较你的算法和该同事算
法的优劣
很明显，他出这个题是期望我在第２问中说用array来记录，然后第３问再让我改成
hash，结果我第二问直接就用hash了。我说时间上差不多，但是用于处理ASCII时，
array比较省空间，处理Unicode时，hash比较省空间
５、如果这个字串数据量很大，而且分布在多台机器上，同时由于带宽限制，不能把整个
hash在多台机器中传输，怎么办？
这题没答上来，花了很长时间，后来先下一题的代码，然后还有时间，继续回答这题，最终还是没答
上来... 阅读全帖

l****p
发帖数: 397

来自主题: JobHunting版 - Google实习第一轮电话面试总结

这个是针对32位unicode的，用hash来存32位unicode字符的记数，这个hash可能会很大

f********s
发帖数: 159

来自主题: JobHunting版 - 写个adobe电面面经

本人cs msfresh半年工作经验。差不多两周前经人推荐面了adobe computer
scientist职位，两轮面完没消息了HR也不回信，move on。
整体感觉他家电面问题很基础，但也比较不常规。
先是HR电话来约电面时间，说就明后两天能面第一轮。约了第二天，一个technical
manager打来电话，上来问简历聊项目，问得特别细，基本我在说他听，时不时问个问
题继续解释。扯了20分钟，他开始介绍公司职位。整体还是很轻松聊天，双方感觉不
错。过后2个小时HR电话说之前面试positive，明天进行面tech。我问能不能改天，
hr说最好就明天，同意了(这个比较汗，不带商量时间)
第二天一个老印面。上来问题假设我初学C++的OOP，给你5分钟教会我基本概念。扯那
套OOP的概念，说了一半他打断问了虚拟，多重继承，copy constructer的概念用法，
分别念代码举例。似乎他比较满意。接着是问在java中这套东西怎么实现，有什么区
别。又问C++和JAVA两个语言的一些区别和概念，聊到效率，跨平台等。问我OOP有什么
disadvantages.然后问到排序... 阅读全帖

t*****s
发帖数: 14

来自主题: JobHunting版 - G家电面被拒，请帮助分析原因

2周前电面G家，一直没有消息，昨天果然收到据信。说是找不到和我背景match的职位
，blah blah，我觉得都是外交语言。我因为自己觉得电面过程还比较顺利，所以想拿
出来，请大家帮着分析分析，到底是什么原因被拒。
看网上一般电面都是连着两轮，但我只有一次。面试者看名字是白人，人很nice，说话
也比较清楚。一开始让我介绍了一下我简历中提到的一个项目，然后就进入coding。两
道题都是基本题。第一题是统计一个字符串里每个字符出现的次数。我先问了是ascii
还是unicode，他说unicode吧，我想这基本就是O(n)的算法，没有什么花样可以变，就
把代码写出来。他检查后觉得没有问题，然后问我如果字符串非常长的话怎么办，我于
是把数组和有关变量都改成long long。他说如果还要长怎么办，我一开始没有想到怎
么办，后来他提醒说指针，于是我理解他是希望直接用指针来index。第二题具体内容
有点忘了，大致是如何在脚本语言里动态获得对象的类。他问我能否用javascript写（
他自己是做javascript安全的），我因为有一段时间没用js，就提议用python写，他说
没问题。... 阅读全帖

r**d
发帖数: 90

来自主题: JobHunting版 - 明天A家onsite

如果不是Unicode
for(int i=0; i {
if (str[i] == "{" || ...)stack.push(str[i]);
else ...
}
如果是Unicode,不清楚是不是two byte去存“{", 反正对方说不行

r*****e
发帖数: 146

来自主题: JobHunting版 - 某家面经

谢谢分享！lz好运！！
“2. 设计一个检索系统。讨论了如果有unicode怎么办，怎么优化，数据量大怎么办，检
索表存在哪里。写了一些code。”
第二题，到底应该如何处理unicode？检索表存在多个地方？不太明白这样的设计题，
需要写什么样的code.只是伪码？还是具体功能的实现？谢谢！

p***y
发帖数: 637

来自主题: JobHunting版 - G onsite面经兼求内推

stream of strings like this
"1 3 4 5 6"
"3 4 5 6 3"
"4 5 6 3 3"
...
这个是anagram的变体，用anagram的解法即可。
换言之只需要统计每个字符串里，每个字符出现的次数.这里字符仅限0-9，因此可以建
立一个表int[] statics = new int[10]; 然后保持0-9出现的次数。对每个字符串计算
一次，然后用hashSet来保持这些statics.遇到重复值，即为每个数字完全一样的，可
以遗弃。
如果不是数字，而是unicode字符，那么以上解法无效。必须对字符串按字符排序放进
hashSet。
如果是unicode字符串，每个字符串又很长。。。。大概要变成设计题，套轮子了。

a********m
发帖数: 15480

来自主题: JobHunting版 - 真羡慕CS科班出身的马公的记忆力

好问题！背ascii确实增加了一点点工作量，但是绝对值得！
ascii其实很简单，只要把下面这个表格背下来就可以了。不光是特殊字符，连换行，
删除键甚至叮当响一声什么的都能背！到时候写出来肯定惊呆面试官。
http://en.wikipedia.org/wiki/ASCII
不过这么做有一个需要注意的缺陷。如果碰到程序里面带中文日文阿拉伯文埃塞俄比亚
文ascii就不行了。不过也还是有解决办法的，虽然要稍微麻烦一点，但是俺相信你的
能力！
这个解决方法就是。。。。。。 UNICODE！只要你背好了。任何国家的码工工作都轻松
搞定！每个字符只是多一倍的内容要背而已，这性价比绝对高！
http://en.wikipedia.org/wiki/Unicode

n***h
发帖数: 10

来自主题: shopping版 - 哪里有可以用的64位中文语言包

这个和有没有汉化的OS无关，主要是因为那些软件的是用非Unicode的编码方式，比如
用GBK码。这样默认的codepage就没法正确理解这个。你得把支持的non-unicode语言改
成中文

d*b
发帖数: 21830

来自主题: shopping版 - windows 7 ultimate版是不是可以直接选择中文系统？

这帮人总是喜欢凭空想象，随便举个例子：紫光拼音就是GB18030的界面，在unicode下
根本就是乱码----unicode的中文定义才3000多字，都没有大字集，怎么正确显示中文？

x****u
发帖数: 44466

来自主题: Japan版 - 谁来给我科普下唐骏的事情啊？

唐骏做的实际上是MS的内部Unicode化工作，这件事和语言无关，但非常需要忽悠能力。
MS程序员是非常不愿意改的，所以直到10年后微软仍然有大量Unicode相关的bug。
另外我认为这个字符串双字节化是非常愚蠢的设计，找个猪头强行推广下去就更蠢了。

K****n
发帖数: 2485

来自主题: LosAngeles版 - 用WIN 7的筒子请进，有问题请教

我台式机上装着Win7 home premium，region里non-unicode设成中国，显示中文基本正
常。只不过所有中文看起来都是同一种字体，貌似没法更改字体。我用了半年吧，各种
软件都用了，没遇到显示问题，可能少数不支持unicode的软件显示会有异常。
Ultimate号称35种语言切换，其实就是装上语言包，可以把菜单显示都变成那一国语言
，字体可能也多些。home premium根本不能装语言包，没这个功能。

l*****5
发帖数: 121

来自主题: NewYork版 - NYC有人会N97刷机么？

Try to install a software called "A4 text input" in your nokia phone and it
should be able to read chinese characters with unicode only. I bought a
nokia e71 from dell and couldn't read chinese too. After i installed "A4
text input", i can read chinese characters in unicode. Try your luck for
the software at www.dospy.com/bbs

b***u
发帖数: 12010

来自主题: NewYork版 - 测　测　你　的　桃　花　年　何　时　出现［转载］ (转载)

知道了。这个数字是这个特殊符的unicode in decimal. [&# ]在这个网页用来解释
unicode. nothing magical

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天