由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Hardware版 - 为什么编程不能用中文编写?
相关主题
Windows 平板 中间有一个矩形区域,笔画不出来苹果真是无敌
听说很快可以用其他语言当域名了3D电影有下载吗?还是一定要在blue-ray上播放?
amd 的cool and quite,怎么在视频编码时还不提升频率啊新蛋上那个能当htpc吗?
有谁知道怎么禁用CanonMP560的InkLevelMonitor么?使用两个27寸的屏幕编码会不会更有效率?
T500从Dock Station无法启动有人用海美迪连win 8电脑共享文件成功过的么?
HD5770对视频编码有专门的优化吗?Re: 一部4K电影x265编码多大比较合适?
PBO wireless怎么设置有人发现google搜索框输中文的问题么?
PBO不能播放AVC编码?请问如何在thinkpad X200 tablet的输入版手写输入汉字?
相关话题的讨论汇总
话题: 汉字话题: 庄来话题: 磨叽话题: 编码话题: 英语
进入Hardware版参与讨论
1 (共1页)
A**********1
发帖数: 1
1
为什么编程不能用中文编写?
a********c
发帖数: 3657
2
20多年前就有了,而且一直活得不错。。。

【在 A**********1 的大作中提到】
: 为什么编程不能用中文编写?
g***n
发帖数: 14250
3
实在是不合算,敲个关键字都要拼音搞半天
g***n
发帖数: 14250
4
不过我觉得用中文写注释是个好主意,哈哈
g***n
发帖数: 14250
5
中文字数多,也许可以弄出很多单个字的关键字来,
但是副词啥的不够多,io in out beyond within without greater less 这些都不好
用单字表达。
a*****e
发帖数: 1700
6
dongbeilang 你值得拥有!
https://github.com/zhanyong-wan/dongbei
a*****e
发帖数: 1700
7
贴个快排
#!/usr/bin/env dongbei
# -*- coding: utf-8 -*-
# 快速排序
【排得贼快】(村子)咋整:
寻思:村子有几个坑 跟 零 一样一样的?
要行咧就 滚犊子吧 村子。

杆子装村子的老大。
几个杆装零。
矮墩庄都是活雷锋。
高个庄都是活雷锋。
哥们儿 在 村子 磨叽:
寻思:哥们儿 跟 杆子 一样一样的?
要行咧就 几个杆走走。
要不行咧就寻思:哥们儿比杆子还小?
要行咧就 矮墩庄来了个哥们儿。
要不行咧就 高个庄来了个哥们儿。
磨叽完了。
顺溜庄都是活雷锋。
矮墩 在 整【排得贼快】(矮墩庄)磨叽:
顺溜庄来了个矮墩。
磨叽完了。
还行从一到几个杆磨叽:
顺溜庄来了个杆子。
磨叽完了。
高个 在 整【排得贼快】(高个庄)磨叽:
顺溜庄来了个高个。
磨叽完了。
滚犊子吧 顺溜庄。
整完了。
# 乱炖庄 = 「2, 3, 7, 6, 2, 8, 2, 1」
乱炖庄都是活雷锋。
乱炖庄来了群路银「二,三,七,六,二,八,二,一」。
唠唠:整 【排得贼快】(乱炖庄)。
# 运行结果:
# --------
# 「1, 2, 2, 2, 3, 6, 7, 8」
x*********4
发帖数: 1
8
汉字为何不能用笔画编码--信息论系列
简介:
汉字的信息熵很大几乎成了汉字不能在信息高速公路上像英语一样驰骋的绊脚石,就好
像高速公路总是不关照巨型车一样,巨型车总是被限速,缴纳更高的费用等所牵绊,英
语就好像一辆保时捷911,而汉语就好像一辆巨型重卡,更为不幸的是,它们还是跑在
中国的高速公路上。其实我们都会注意到,汉字信息熵确实很大,一方面汉字携带的信
息量比英语大得多,我们的汉字总是不同的读法不同的语气代表不同的含义,但是这并
不是造成汉字在编码中被冷落的原因,它被冷落的原因在于它的字形。
汉字是方块的,遵循从上到下从左到右的顺序,它是一个二维的平面结构,在水平和垂
直两个方向延展,不像英语是个水平的线性结构,汉字拥有独特的间架结构,比如左右
结构,上中下结构等等,而英语却没有,英语总是在水平方向简单的延伸,这个区别导
致汉字更加紧凑,一个方块的空间可以集合很多的语义,不过这也是汉字不能被简单编
码的根本原因,我们知道英语中最基本的元素是字母,一共26个字母,编码中可以对这
26个字母分别编码,然后编码的组合就代表了字母的组合,除了字母的编码之外英语编
码以及在计算机内部实现没有任何额外的问题,它没有位置问题,因为一维结构而且从
左向右延展会使得编码默认按照这个约定排列,现在我们来看一下汉字的情况,汉字最
基本的元素是笔画,笔画的数量不会多于英语的字母,如果就到此为止,那么我们按照
笔画来编码的话,汉字的信息熵不会很高,而且比英语还低,恰恰就是在这里汉字在现
代计算机编码系统里出了问题,汉字是二维的,增加了一个纬度,这样就增加了两个自
由度,而信息的定义就是消除不确定性,自由度增加等于增加了不确定性,按照热力学
解释,自由度增加带来了熵增加,在信息论中,信息获得就是自由度的减少,就是一种
负熵,也就是说,信息熵表示主体付出的努力,由此可见除了笔画编码问题,汉字中还
有一个英语中没有的问题就是间架结构问题,也就是说谁也不能默认汉字笔画的排列顺
序,并且笔画的长短不同就会出现不同的字,笔画的不同书写顺序也会成为不同的字,
比如“土”和“士”以及“干”,这些规则谁来定义,汉字基本反映了我们人类特有的
思维过程,当代的计算机根本办不到这些,因此笔画编码不单单是将笔画简单编码就拉
倒了,还有一系列的组合规则,结构规则以及排列规则,这些规则太复杂了,计算机根
本无法完成这些任务的计算,因此汉字只能单个字编码,这里就出现了问题,汉字总量
虽然不多,但是完全要参加编码,这就比英语的26个元素多得多了,因此汉字的信息熵
非常大。随着新的汉字引入,其信息熵还会更大。
前面说过,汉字是方块的形状,二维的延伸结构使得它更紧凑,相同的空间可以代表更
多的含义,举个例子,英语中的两个单词只有两种排列方式,而汉字却有四种方式,回
忆前面说的二进制理论就会发现汉字的信息熵确实很大。有个问题现在可以说一下了,
汉字组合成的词语一般都很短,而且总是可以用已有的汉字组合来描述新词,而英语就
不同了,如果英语也用现有的单词组成新词,那么它的二维结构会使单词越来越长,因
此英语往往用发明新词的方式来进行扩展,比如,牛,奶牛,母牛,公牛,野牛,在汉
字中都有牛字,分别加上一些个性的东西成为另一个概念,而在英语中这些词却是几乎
不相关的单词,这就引出了本文的另一个问题,就是汉字与面向对象。
汉字怎么会和面向对象联系呢?在详述之前我们来做一个类比,汉字相当于面向对象的
语言,而英语相当于汇编语言,汇编语言的基本元素就是cpu指令,必须过程化执行,
顶多用个jmp或者call,而面向对象语言写的代码中却呈现了继承,包含,等多维结构
,看看c++的菱形继承就知道了,即便没有那种不提倡的菱形,在OO设计图上,也会充
斥着很多的类图,这些类错综复杂相联系,最终这个类图就是代码本身,而汇编语言设
计程序时主要用流程图来进行,纯粹的先来后到的过程化处理。我们看一下上面的“牛
”的例子,牛可以作为基类,然后奶牛,母牛作为牛的派生类,拥有了自己的特征,看
看是不是都有“牛”这个字,在一篇文章中看到一句话“共性上加个性就是新概念;组
合性非常强;”,这句话非常形象,也非常好。汉字基本是人类思维的真实反映,因此
你就别指望计算机一台机器可以模拟这种真实反应,想想机器可以直接执行“类的方法
”吗?机器执行的过程就好像英语的过程,很精确但是却很呆板,信息熵低的目的在于
容易识别,热消耗低而不是别的什么。
x*********4
发帖数: 1
9
不知道你这是纯粹民族主义作祟,还是想干嘛。
首先本来就没有什么英语编程,也就无所谓汉语编程,一门程序语言也就几十个保留字
,除了这几十个英语单词外,其他的和英语也没什么关系。就算挑几十个汉语词汇来替
代他们,难道就是汉语编程了吗。代码最终是要编译成机器码的,一堆0,1组成的二进
制符号,你说它是哪国语言。
一个项目所有的程序代码里除了上述提到的保留字外,基本就剩下符号、各种名称和注
解文字了,注解随便你写什么都行,而当下主流的程序语言大多都支持用中文来命名的
,只不过为了可读性、稳定性等原因,一般都会用英文命名,而且有约定的命名规则,
用汉字则可能会有文件编码问题,一旦存储不当可能乱码掉(这种事儿很少见,但总还
是会碰到,原因大概就是你说的因为电脑是美国人发明的,英文只有26个字母,算上大
小写和特殊符号,也没多少,所以早期文件是ASCII码存放的,但西文的编码方案保存
不了汉字)。
那些所谓的汉语编程,不过也就是个噱头,骗一骗玩票的人们罢了,如果你自己写一个
自己玩的小工具,用什么语言还不是随你吗,但如果是做一个大项目,就不要人为制造
障碍了。
g***n
发帖数: 14250
10
编程语言就是为了方便人和机器沟通,当然是越复合人类习惯越好用,如果汉语的确方
便的话当然可以。最终还是看哪种更方便,同时也满足必要的语法规则,编译器可以实
现。
z****3
发帖数: 782
11
有好几种,都不太流行
易语言 http://www.eyuyan.com/eprc.htm
文言编程 https://github.com/wenyan-lang/wenyan
P****R
发帖数: 22479
12
没人用,无法流行。

【在 z****3 的大作中提到】
: 有好几种,都不太流行
: 易语言 http://www.eyuyan.com/eprc.htm
: 文言编程 https://github.com/wenyan-lang/wenyan

1 (共1页)
进入Hardware版参与讨论
相关主题
如果互联网是中国发明的T500从Dock Station无法启动
关于回帖乱码的问题HD5770对视频编码有专门的优化吗?
何为信息熵PBO wireless怎么设置
C++可完全取代C吗?PBO不能播放AVC编码?
Windows 平板 中间有一个矩形区域,笔画不出来苹果真是无敌
听说很快可以用其他语言当域名了3D电影有下载吗?还是一定要在blue-ray上播放?
amd 的cool and quite,怎么在视频编码时还不提升频率啊新蛋上那个能当htpc吗?
有谁知道怎么禁用CanonMP560的InkLevelMonitor么?使用两个27寸的屏幕编码会不会更有效率?
相关话题的讨论汇总
话题: 汉字话题: 庄来话题: 磨叽话题: 编码话题: 英语