由买买提看人间百态

topics

全部话题 - 话题: unicode
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
z*******n
发帖数: 1034
1
http://www.informit.com/articles/printerfriendly/2211695
Introduction to "The Java Language Specification, Java SE 8 Edition"
By James Gosling, Gilad Bracha, Alex Buckley, Bill Joy, Guy L. Steele
Date: Jun 12, 2014
The Java® programming language is a general-purpose, concurrent, class-
based, object-oriented language. It is designed to be simple enough that
many programmers can achieve fluency in the language. The Java programming
language is related to C and C++ but is organized rather dif... 阅读全帖
s********u
发帖数: 1109
2
来自主题: JobHunting版 - Google第二轮电面
好像是一个unicode对应多个char。而且比如ab是一个unicode,cd是一个unicode,但
是abcd也可能是一个unicode,所以他一直在跟我解释怎么标记这些。但肯定有办法区
分的,否则就不是唯一了,那还怎么表示字符啊,又不是word break问题。应该多由我
来问
的,这些更清楚些。
最后也不知道是不是到底这意思。
s********u
发帖数: 1109
3
来自主题: JobHunting版 - Google第二轮电面
好像是一个unicode对应多个char。而且比如ab是一个unicode,cd是一个unicode,但
是abcd也可能是一个unicode,所以他一直在跟我解释怎么标记这些。但肯定有办法区
分的,否则就不是唯一了,那还怎么表示字符啊,又不是word break问题。应该多由我
来问
的,这些更清楚些。
最后也不知道是不是到底这意思。
B********4
发帖数: 7156
4
在Visual Studio中的Debug模式下,如果声明一个变量,但是没有初始化,微软会给未
初始化的内存复制为0xCC。给为初始化的内存赋0xCC是有原因的,0xCC其实是INT3中断
指令,所以如果在Debug模式下试图去执行这块未初始化的内存的话就会中断程序。但
VS中调试器默认的字符集是MBCS,而在MBCS中0xCCCC正好就是中文中“烫”,所以显示
出来就都是烫……
锟斤拷则涉及unicode的字符集转换问题,Unicode和老编码体系的转化过程中,肯定有
一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就
是:U+FFFD REPLACEMENT CHARACTER。U+FFFD的UTF-8编码是0xEFBFBD,如果重复多次
形成:EFBFBDEFBFBDEFBFBD 这样在GBK/CP936/GB2312/GB18030的环境(都是中国标准
惹的祸)中显示的话,一个汉字2个字节,最终的结果就是:锟斤拷——锟(0xEFBF),
斤(0xBDEF),拷(0xBFBD)……
X****r
发帖数: 3557
5
来自主题: Programming版 - 顺便问一个CreateFile问题 (转载)
这个和CreateFile没什么关系,你要在UTF-16和UTF-8之间进行转换的话用
wcstombs/mbstowcs这些函数。
http://msdn.microsoft.com/en-us/library/6y9se58z(VS.71).aspx
另外,你如果用printf/wprintf系列函数写文件的话,可以用%S而不是通常的%s来表明
你传进去的字符串是另一种encoding。
http://msdn.microsoft.com/en-us/library/hf4y5e3w.aspx
顺便说一下,Unicode是指Character Set,UTF-16和UTF-8都是Unicode的一种encoding。
只是在VS里经常就把UTF-16称作Unicode。

unicode
c******n
发帖数: 4965
6
来自主题: Programming版 - sucks (转载)
unicode code point value can go larger than 65535
anyway that book made a conceptual error : it's meaningless to talk about
the "length" of unicode, unicode is just a number, when we talk about length
, it's always the *encoded* length under a charset.
java char can only represent the BMP and surrogate part of unicode, that's
what the book should say
g********d
发帖数: 19244
7
来自主题: Automobile版 - [合集] RE: 奔驰质量很令人担忧
☆─────────────────────────────────────☆
iMaJia (iMac,iPod,iPad,i馬甲) 于 (Mon May 6 17:04:13 2013, 美东) 提到:
6个月前买的 2013 MB C350. 前侧一个或多个喇叭间歇性没声音. 挡风玻璃水刮运行不
流畅, 一顿一顿的. 而且雨水探测器有时发疯. 昨天微微小雨,停在红灯前, 忽然水刮
以最大速度狂刮不止. 关了重开才正常
这是都TNND的什么质量
Update:
上个月跑了3次dealer, 换了左侧扬声器. 上星期发现右侧扬声器也有同样的问题, 也
是随机没有声音. 开始怀疑这不是音箱的问题,是立体声机单元问题. 今天左侧扬声器
又没有声音了.
其它不满意:
- 还有, 用microSD卡放MP3, 有时一开车就马上可以听, 有时刚停5分钟, 打火后车要
"reading from memory card" 一段时间才能听. 这又是什么原理...
- 有时 bluetooth 语音命令电话拨号, 语音回复 "that command is not available
n... 阅读全帖
v***a
发帖数: 365
8
来自主题: JobHunting版 - Google实习第一轮电话面试总结

冲突
多谢分享!比atoi有意思多了。。。。
感觉32位Unicode字符统计BST或许会好点。
分布的情况貌似可以这样:
1)所有机器的Top 1% freqent unicodes. 得到这些集合的交集 X。
2)如果 X 是空集,扩展到2%,重做,直到X不是空集。
3)频率最高的在 X 中,统计X中所有unicodes的频率,取最高
肯定code不出来了,涉及到了BST, Heap, Hash, Disjoint Set and splay tree.
而且最坏情况还是传输了所有机器的 BST……比 hash 还糟糕点,呵呵
攒点字数,RP守恒!
d*b
发帖数: 21830
9
早说了,国内很多软件的中文界面不是unicode的,是GB18030的。如果你不明白为什么
不用unicode,自己看信息产业部的公文吧。同样道理,为什么中文版的windows是GB码
而不是unicode. 英文版的windows不native支持中文GB码,为什么总有那么多自做聪明
的人jjww这jjww那呢?
k***e
发帖数: 7933
10
来自主题: shopping版 - 问个中文显示的问题
【 以下文字转载自 Software 讨论区 】
发信人: kanke (回家), 信区: Software
标 题: 问个中文显示的问题
发信站: BBS 未名空间站 (Thu Oct 21 00:17:29 2010, 美东)
winxp,安装了中文包,non-unicode default选了中文,安装了搜狗输入法。在dos
window里面可以激活搜狗输入法,也可以显示中文。
win7 x86,安装了中文包,non-unicode default选了中文,安装了搜狗输入法。但是
在dos window里面不能激活搜狗输入法,也不能显示中文。上网可以看中文,中文的软
件运行也可以显示中文。
请问怎么才能在win7的dos window里显示中文??
最初的问题是我安装了subversion for windows(http://sourceforge.net/projects/win32svn/),都是一些command line,而且这些command的输出都是中文的(是不是因为我non-unicode default选了中文的原因?),这个在winxp上没有问题,但是在wi... 阅读全帖
s**********9
发帖数: 1238
11
来自主题: LosAngeles版 - 用WIN 7的筒子请进,有问题请教

恩,似乎可行。。。
目前放狗的结果是HOME PREMIUM上运行UNICODE 中文软件是没问题的,NONE-UNICODE出
现乱码,还有某些字幕也会乱码。
如果在REGION里把NONE-UNICODE 区域改中国似乎可以解决这个问题吧
f******s
发帖数: 541
12
USB和舟子的旧事
(兼论舟子的“子”)
解滨
本来都已经说好了不再谈方舟子的文坛旧事了,但上个星期发生的那起USB事件让俺想
起了17年前发生的一件网络上的大事。 俺要是不把那件事说出来,不但对不起网上的
老少爷们,也对不起历史。 所以俺破例再写一集,就算是集外集吧。
上星期,新片《黄金大劫案》的主创到上海复旦大学松江校区会学子。导演宁浩弄来大
牌英语培训专家罗永浩坐镇,更请到青春偶像韩寒压轴登场,场面火爆。韩寒念念不忘
拿对头方舟子开涮:“在人生当中有很多不如意事情,有很多的人在背后诋毁你。但我
只有一句话,路边几条臭水沟,不及江河万古流。” 现场的最高潮,还是韩寒和罗永
浩对方舟子的调侃。 宁浩现场送二人每人一个“金砖U盘”。罗永浩接过金砖U盘后,
立马声明,“我在方舟子出来说之前说,这是假的金砖。” 主持人让二位送给方舟子
一句话,韩寒毫不犹豫地说,“这是个USB吧,我想对他说三个字:U,SB!”
这话让MM们当场笑翻。 看来韩寒未必是完全不学无术,但他脑瓜子有点歪,却歪而不
邪。方舟子看了后会怎么想? 这个连俺都知道:
1. 韩寒,一个只会泡妞的赛车司机,一个体育生,文章靠... 阅读全帖
M*P
发帖数: 6456
13
Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,
Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT
CHARACTER。
那么U+FFFD的UTF-8编码出来,恰好是 'xefxbfxbd'。如果这个'xefxbfxbd',重复多次
,例如 'xefxbfxbdxefxbfxbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的
话,一个汉字2个字节,最终的结果就是:锟斤拷——锟(0xEFBF),斤(0xBDEF),拷
(0xBFBD)

【 以下文字转载自 TVGame 讨论区 】
H********g
发帖数: 43926
14
来自主题: Joke版 - 关于回帖乱码的问题
我今天刚研究了一下unicode 原来由于历史原因windows里常用的是utf16 或者gbk

要分辨少量2字节的utf16汉字和同样2字节的gb汉字可能比较困难 所以造成目前这种
回复里有两种编码的情况
现在看起来所有的东西都在往unicode转变 所以gbk迟早是要被淘汰的 毕竟它只是
一种地方编码 只有写简体汉字才方便
unicode里 utf16和ascii不是兼容的 但utf8和ascii是完全兼容的 因此用utf8
的网页文件可以只包含单一编码 处理起来比含有gb或者utf16的网页可能简单一些
utf8里一个汉字3字节而不是两个 gb和大部分常用utf16汉字是2字节 但这个代
价其实很小 尤其考虑到网页本身的代码(数量可能比汉字内容多许多)都是ascii 在
utf8里只有一个字节 用utf8的网页跟用gbk的比 只是汉字部分大了一半
所以结论是 如果彻底转成utf8 可以完全解决乱码问题
l**n
发帖数: 7272
15
来自主题: Apple版 - Unix的缺陷(ZT)
虽然这里的码工比较少,但是能appreciate coding和programming的朋友也可以看看。
我觉得挺有意思的。
http://blog.sina.com.cn/s/blog_5d90e82f01014k5j.html
我想通过这篇文章解释一下我对 Unix 哲学本质的理解。我虽然指出 Unix 的一个设计
问题,但目的并不是打击人们对 Unix 的兴趣。虽然 Unix 在基础概念上有一个挺严重
的问题,但是经过多年的发展之后,这个问题恐怕已经被各种别的因素所弥补(比如大
量的人力)。但是如果开始正视这个问题,我们也许就可以缓慢的改善系统的结构,从
而使得它用起来更加高效,方便和安全,那又未尝不可。同时也希望这里对 Unix 命令
本质的阐述能帮助人迅速的掌握 Unix,灵活的应用它的潜力,避免它的缺点。
通常所说的“Unix哲学”包括以下三条原则[Mcllroy]:
一个程序只做一件事情,并且把它做好。
程序之间能够协同工作。
程序处理文本流,因为它是一个通用的接口。
这三条原则当中,前两条其实早于 Unix 就已经存在,它们描述的其实是程序设计最... 阅读全帖
s*****y
发帖数: 3
16
我用libxml2 parser.h 中的 xmlReadFile 打开一个xml file
xmlReadFile 的 parameter -> const char *URL 不支持 wchar,所以当xml file的
path 是 Unicode时, 需要用WideCharToMultiByte转化。 但是如果Unicode的path有
非英文字符时,这也方法就行不通了。
有没有什么方法可用libxml2 的api,open unicode path的 xml file呢?
谢谢!
d****n
发帖数: 5
17
(1)Java works internally with Unicode, so when compiling source code files
that used a Chinese encoding such as Big5 or GB2312, you need to specify the
encoding to the compiler in order to properly convert it to Unicode.
javac -encoding big5 sourcefile.java
or
javac -encoding gb2312 sourcefile.java
(2)If you read chinese chars from a file or database, most likely it is gb2312
or big5 encoding, then you have to map them to Unicode.
l***s
发帖数: 28
18
【 以下文字转载自 Programming 讨论区 】
【 原文由 Links 所发表 】
我下载java J2SE的时候, 选择了下载boudle with NetBeans IDE。 结果
这个家伙, sigh, 一言难尽啊。 我的机器是英文版windows XP。 为了让
terminal 可以显示中文, 我就在language setting里边选择了, non-unicode
的program, 使用default 中文。 这个选择对unicode 的软件没有影响。
可是没想到这个NetBeans居然是个随风倒的家伙。 当我开启的时候, 它就
自动默认我的系统语言是Chinese, 所以软件成了中文版本。 看起来别扭级了。
然后我turn off language setting 中non-unicode program default lang - Chinese
以后呢, 再启动netbeans, 他就变成英文版奔了。 可是turn off 以后,
存中文软件就不能显示中文窗口了。 telnet也不能看中文了。 :( 而且
switch on and off每次需要重新启
w****g
发帖数: 597
19
谢谢goodbug的及时答复.
我已经按照你的建议在Reginal and Language Options中,设置了:
1) In Reginal option Tab, set "Location" to US, and,
2) In Advanced Tab, set "Language for non-unicode programs" to Chinese.
then, I restart WinXP, let new setup take effect.
结果,编译Java代码的文字提示还是汉字,而不是英文文字提示. 我上面的步骤1与2理
解是正确无误吗?
我自己再一次试验设置了: 1)set Location to US; 2)Language for non-unicode to
English,结果,编译Java代码的文字提示变成了乱码,既不是英文也不是汉字.只好又恢
复成: 1)location=US; 2)Language for non-unicode=Chinese. 结果, 编译Java代码
的提示文字也恢复为汉字了, 问题还是没有得到解决. 难道只有把英文
z***e
发帖数: 5393
20
来自主题: Programming版 - 顺便问一个CreateFile问题 (转载)
【 以下文字转载自 Seattle 讨论区 】
发信人: zlike (最终幻想), 信区: Seattle
标 题: 顺便问一个CreateFile问题
发信站: BBS 未名空间站 (Sat Jun 7 04:04:00 2008)
Visual Studio里面缺省是Unicode.
随便const TCHAR *s=_TEXT("asdfsdfsdfsddfsdfsddfdsfsdf");
然后CreateFile(),WriteFile(....)....
那个出来的text文件始终是Unicode的,如果改project configuration,改成unset的话
就是ANSI,问题是我要UTF-8的,怎么生成啊?
之所以要UTF-8,是因为生成的是一个xml,然后另外一个C#的程序去读,如果unicode
的话那个C#里面的那个XMLxxxx就要发神经报错,ANSI就没问题。
s*****y
发帖数: 3
21
来自主题: Software版 - 用libxml2 API open xml file的问题
我用libxml2 parser.h 中的 xmlReadFile 打开一个xml file
xmlReadFile 的 parameter -> const char *URL 不支持 wchar,所以当xml file的
path 是 Unicode时, 需要用WideCharToMultiByte转化。 但是如果Unicode的path有
非英文字符时,这也方法就行不通了。
有没有什么方法可用libxml2 的api,open unicode path的 xml file呢?
谢谢!
k***e
发帖数: 7933
22
来自主题: Software版 - 问个中文显示的问题
winxp,安装了中文包,non-unicode default选了中文,安装了搜狗输入法。在dos
window里面可以激活搜狗输入法,也可以显示中文。
win7 x86,安装了中文包,non-unicode default选了中文,安装了搜狗输入法。但是
在dos window里面不能激活搜狗输入法,也不能显示中文。上网可以看中文,中文的软
件运行也可以显示中文。
请问怎么才能在win7的dos window里显示中文??
最初的问题是我安装了subversion for windows(http://sourceforge.net/projects/win32svn/),都是一些command line,而且这些command的输出都是中文的(是不是因为我non-unicode default选了中文的原因?),这个在winxp上没有问题,但是在win7上就都是乱码了。 有人知道怎么才能让这个subversion for windows command的输出时英文?
谢谢
s*****y
发帖数: 3
23
我用libxml2 parser.h 中的 xmlReadFile 打开一个xml file
xmlReadFile 的 parameter -> const char *URL 不支持 wchar,所以当xml file的
path 是 Unicode时, 需要用WideCharToMultiByte转化。 但是如果Unicode的path有
非英文字符时,这也方法就行不通了。
有没有什么方法可用libxml2 的api,open unicode path的 xml file呢?
谢谢!
x*******u
发帖数: 500
24
来自主题: Statistics版 - help! 读CSV文件读得要崩溃了
谢谢大家的帮助, 最后是SAS Technical Support 解决了问题。
It looks like you may have a Unicode file that has a hex '00' between each
character. Are you using PROC IMPORT to read the file? Use a FILENAME
statement to create a fileref for the file you want to read. On the
FILENAME statement add the ENCODING=UNICODE option. Then in the PROC IMPORT
, use DATAFILE=.
For example,
filename temp 'c:\temp\qualityinfo.csv' encoding="unicode" lrecl=32767;
proc import datafile=temp out=quality dbms=csv ... 阅读全帖
c***s
发帖数: 70028
25
一眨眼,2017已过去一半。这期间,“谣言”还是时常出现。而且还多了一种新的常见传播形式,就是用视频来传谣。
今天,小编就整理出了这半年中的十大朋友圈谣言,一起来看看吧。
朋友圈十大谣言
1、肉松面包上的肉松是棉花做的
谣言类别:失实报道
欺骗指数:★★★★★
危害指数:★★★★
谣言内容:
5月下旬,多段浸泡肉松面包上的肉松视频在网上流传,拍摄者来自不同地区,但内容基本一致:买来肉松面包或糕点后,将上面的肉松泡入水中,肉松在水中变成白色絮状物体,拍摄者声称这些肉松其实是棉花做的,并用白色絮状物可用打火机点燃作为证明。
真相:
国家食药监局的官方微信平台“中国食事药闻”对“肉松饼包棉花”这类视频进行了辟谣:肉松和棉花二者成分不同,口感也存在很大差异,用棉花冒充肉松几乎不可能。
肉松的本质是肌肉纤维,主要成分为蛋白质,放入嘴里一咬就会融化,口感松软。而棉花的本质是植物纤维,主要成分为纤维素,是一种不可溶的纤维,虽然看上去也很松软,但嚼不烂。也就是说,真用棉花冒充肉松,一吃就会被识破。
相关专家还指出,视频中所使用的“火烧”鉴别法看似科学,其实也不靠谱。食物可以被点燃是一种普遍现象,因为... 阅读全帖
i****a
发帖数: 36252
26
来自主题: Automobile版 - 车音响可以 rip CD,挺方便的
我刚研究明白了. MP3 的 tag 要用 ID3 unicode encoding. 我用windows media
player internet album info 自动生成的tag是 big5 encoding, 车方是显乱码. 用
tag convertor (网上 freeware) 换成 unicode 就可以显示了.

[发表自未名空间手机版 - m.mitbbs.com]
u*********r
发帖数: 176
27
然后是音乐界面,这个播放器支持Unicode, 只要MP3文件的IDv3 tag是用unicode编码
的,就能显示,而且封面图也能显示
g********d
发帖数: 19244
28
☆─────────────────────────────────────☆
uninstaller (卸载程序) 于 (Fri Apr 5 17:27:44 2013, 美东) 提到:
不熟悉F平台的先看看Wiki,
http://en.wikipedia.org/wiki/BMW_5_Series_(F10)#BMW_5_Series_Se
简单的说就是7系底盘,跟F01共享
外观神马的我先略过,网上搜图一大票,不过内部我重点介绍下,
我对BMW的5系细节非常满意
具体有几个,首先是快捷方式的按键是带触感的,如果手放上去了,屏幕会出现快捷方
式菜单
☆─────────────────────────────────────☆
uninstaller (卸载程序) 于 (Fri Apr 5 17:32:37 2013, 美东) 提到:
貌似占楼不好发图,就这样吧
内饰的细节设计,
这个发光的条我灰常喜欢,晚上十分好看,而且可以照明一些按钮,亮度可以,不刺眼睛
☆─────────────────────────────────────☆
uninst... 阅读全帖
i****a
发帖数: 36252
29
来自主题: Automobile版 - 我的小奔又光荣入厂了
是不是要转成 unicode. 我用unicode rewriter. 简单,绿色,免费

[发表自未名空间手机版 - m.mitbbs.com]
f****o
发帖数: 4067
30
来自主题: Automobile版 - 有没有开toyota,lexus的. 紧急咨询
我也有Honda系统的. 如果是gb/big5,显示乱码. 转成unicode后正常显示.
lexus完全不显示. 播放没问题. 歌曲名,歌手显示一个横杠"-". 英文没有问题. 如果
unicode都不显示,够落后的. 别人买车也注意了,想显示中文歌名的话,toyota
infotainment 就是不行.
k**o
发帖数: 15334
31
来自主题: Automobile版 - Toyota 车其实不是日车是美车
CJK是share的unicode block,支持日文必然也要支持中文和韩文。除非
现在还有奇葩系统不用 unicode.
k******u
发帖数: 3137
32
你知道的错了, 不是unicode, 是改non-unicode 成中文
o******e
发帖数: 81
33
来自主题: JobHunting版 - Amazon电面面经
btw这个是俺的马甲
今天第一轮电面,我是experienced的不是fresh
感觉不怎么好,就问了一道题,太多detail了
电话来迟了8分钟,加拿大人。先问了问最challenge/favorite的project,说了几分钟
后他说我知道了,考你个题吧
很简单,Unicode的charactor array/string,找出现次数最多的char
我给了3个解,基本没有用任何考虑时间
1. double loop, O(n^2)
2. hash,他问我worse case,我一不留神说了O(n),忘了hash的陷阱。他说恩perfect
hashing是不存在的,blablabla,我说我完全同意。我说如果space足够的话效率比较
好的char hashing是不太难的,他说anyway那也是O(n),好吧。。
3. int[65536]的array,因为是unicode,我跟他确认了一下是2 bytes。我一开始说复
杂度的时候原来的solution是iterate string一遍,然后iterator count的array一遍
,突然想到可以用一个temp varia... 阅读全帖
l****p
发帖数: 397
34
来自主题: JobHunting版 - Google实习第一轮电话面试总结
两通电话,每个45min,到最后两个都超时
第一通电话:
1、指定我简历中的一篇一作文章,让我描述那文章里的内容
2、如何从一个只含有ASCII字符的字符串中找出最频繁的字符
我说用哈希表记录每个字符出现次数,然后他又补充问到哈希表是怎么工作的,我说包
括哈希函数和冲突处理两部分,并简述了一下,说由于字符不太多,可以用链表处理冲突
3、如果这个字符串含有32位Unicode字符的串,如何修改之前的算法
我说为了节省空间,可以把冲突处理方式改成rehashing
4、如果一个同事提出用一个array来记录各个字符的次数,比较你的算法和该同事算
法的优劣
很明显,他出这个题是期望我在第2问中说用array来记录,然后第3问再让我改成
hash,结果我第二问直接就用hash了。我说时间上差不多,但是用于处理ASCII时,
array比较省空间,处理Unicode时,hash比较省空间
5、如果这个字串数据量很大,而且分布在多台机器上,同时由于带宽限制,不能把整个
hash在多台机器中传输,怎么办?
这题没答上来,花了很长时间,后来先下一题的代码,然后还有时间,继续回答这题,最终还是没答
上来... 阅读全帖
l****p
发帖数: 397
35
来自主题: JobHunting版 - Google实习第一轮电话面试总结
这个是针对32位unicode的,用hash来存32位unicode字符的记数,这个hash可能会很大
f********s
发帖数: 159
36
来自主题: JobHunting版 - 写个adobe电面面经
本人cs msfresh半年工作经验。 差不多两周前经人推荐面了adobe computer
scientist职位,两轮面完没消息了HR也不回信,move on。
整体感觉他家电面问题很基础,但也比较不常规。
先是HR电话来约电面时间,说就明后两天能面第一轮。约了第二天,一个technical
manager打来电话,上来问简历聊项目,问得特别细,基本我在说他听,时不时问个问
题继续解释。 扯了20分钟,他开始介绍公司职位。整体还是很轻松聊天,双方感觉不
错。过后2个小时HR电话说之前面试positive, 明天进行面tech。 我问能不能改天,
hr说最好就明天,同意了(这个比较汗,不带商量时间)
第二天一个老印面。上来问题假设我初学C++的OOP,给你5分钟教会我基本概念。扯那
套OOP的概念,说了一半他打断问了虚拟,多重继承,copy constructer的概念用法,
分别念代码举例。似乎他比较满意。 接着是问在java中这套东西怎么实现,有什么区
别。又问C++和JAVA两个语言的一些区别和概念,聊到效率,跨平台等。问我OOP有什么
disadvantages.然后问到排序... 阅读全帖
t*****s
发帖数: 14
37
来自主题: JobHunting版 - G家电面被拒,请帮助分析原因
2周前电面G家,一直没有消息,昨天果然收到据信。说是找不到和我背景match的职位
,blah blah,我觉得都是外交语言。我因为自己觉得电面过程还比较顺利,所以想拿
出来,请大家帮着分析分析,到底是什么原因被拒。
看网上一般电面都是连着两轮,但我只有一次。面试者看名字是白人,人很nice,说话
也比较清楚。一开始让我介绍了一下我简历中提到的一个项目,然后就进入coding。两
道题都是基本题。第一题是统计一个字符串里每个字符出现的次数。我先问了是ascii
还是unicode,他说unicode吧,我想这基本就是O(n)的算法,没有什么花样可以变,就
把代码写出来。他检查后觉得没有问题,然后问我如果字符串非常长的话怎么办,我于
是把数组和有关变量都改成long long。他说如果还要长怎么办,我一开始没有想到怎
么办,后来他提醒说指针,于是我理解他是希望直接用指针来index。第二题具体内容
有点忘了,大致是如何在脚本语言里动态获得对象的类。他问我能否用javascript写(
他自己是做javascript安全的),我因为有一段时间没用js,就提议用python写,他说
没问题。... 阅读全帖
r**d
发帖数: 90
38
来自主题: JobHunting版 - 明天A家onsite
如果不是Unicode
for(int i=0; i {
if (str[i] == "{" || ...)stack.push(str[i]);
else ...
}
如果是Unicode,不清楚是不是two byte去存“{", 反正对方说不行
r*****e
发帖数: 146
39
来自主题: JobHunting版 - 某家面经
谢谢分享!lz好运!!
“2. 设计一个检索系统。讨论了如果有unicode怎么办,怎么优化,数据量大怎么办,检
索表存在哪里。写了一些code。”
第二题,到底应该如何处理unicode?检索表存在多个地方?不太明白这样的设计题,
需要写什么样的code.只是伪码?还是具体功能的实现? 谢谢!
p***y
发帖数: 637
40
来自主题: JobHunting版 - G onsite面经兼求内推
stream of strings like this
"1 3 4 5 6"
"3 4 5 6 3"
"4 5 6 3 3"
...
这个是anagram的变体,用anagram的解法即可。
换言之只需要统计每个字符串里,每个字符出现的次数.这里字符仅限0-9,因此可以建
立一个表int[] statics = new int[10]; 然后保持0-9出现的次数。对每个字符串计算
一次,然后用hashSet来保持这些statics.遇到重复值,即为每个数字完全一样的,可
以遗弃。
如果不是数字,而是unicode字符,那么以上解法无效。必须对字符串按字符排序放进
hashSet。
如果是unicode字符串,每个字符串又很长。。。。大概要变成设计题,套轮子了。
a********m
发帖数: 15480
41
来自主题: JobHunting版 - 真羡慕CS科班出身的马公的记忆力
好问题! 背ascii确实增加了一点点工作量,但是绝对值得!
ascii其实很简单,只要把下面这个表格背下来就可以了。不光是特殊字符,连换行,
删除键甚至叮当响一声什么的都能背!到时候写出来肯定惊呆面试官。
http://en.wikipedia.org/wiki/ASCII
不过这么做有一个需要注意的缺陷。如果碰到程序里面带中文日文阿拉伯文埃塞俄比亚
文ascii就不行了。不过也还是有解决办法的,虽然要稍微麻烦一点,但是俺相信你的
能力!
这个解决方法就是。。。。。。 UNICODE!只要你背好了。任何国家的码工工作都轻松
搞定!每个字符只是多一倍的内容要背而已,这性价比绝对高!
http://en.wikipedia.org/wiki/Unicode
n***h
发帖数: 10
42
来自主题: shopping版 - 哪里有可以用的64位中文语言包
这个和有没有汉化的OS无关,主要是因为那些软件的是用非Unicode的编码方式,比如
用GBK码。这样默认的codepage就没法正确理解这个。你得把支持的non-unicode语言改
成中文
d*b
发帖数: 21830
43
这帮人总是喜欢凭空想象,随便举个例子:紫光拼音就是GB18030的界面,在unicode下
根本就是乱码----unicode的中文定义才3000多字,都没有大字集,怎么正确显示中文?
x****u
发帖数: 44466
44
唐骏做的实际上是MS的内部Unicode化工作,这件事和语言无关,但非常需要忽悠能力。
MS程序员是非常不愿意改的,所以直到10年后微软仍然有大量Unicode相关的bug。
另外我认为这个字符串双字节化是非常愚蠢的设计,找个猪头强行推广下去就更蠢了。
K****n
发帖数: 2485
45
来自主题: LosAngeles版 - 用WIN 7的筒子请进,有问题请教
我台式机上装着Win7 home premium,region里non-unicode设成中国,显示中文基本正
常。只不过所有中文看起来都是同一种字体,貌似没法更改字体。我用了半年吧,各种
软件都用了,没遇到显示问题,可能少数不支持unicode的软件显示会有异常。
Ultimate号称35种语言切换,其实就是装上语言包,可以把菜单显示都变成那一国语言
,字体可能也多些。home premium根本不能装语言包,没这个功能。
l*****5
发帖数: 121
46
来自主题: NewYork版 - NYC有人会N97刷机么?
Try to install a software called "A4 text input" in your nokia phone and it
should be able to read chinese characters with unicode only. I bought a
nokia e71 from dell and couldn't read chinese too. After i installed "A4
text input", i can read chinese characters in unicode. Try your luck for
the software at www.dospy.com/bbs
b***u
发帖数: 12010
47
知道了。这个数字是这个特殊符的unicode in decimal. [&# ]在这个网页用来解释
unicode. nothing magical
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)