linux 文件大小的问题 - Programming版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - linux 文件大小的问题

相关主题
● 文件大小疑惑	● file modification questions in linux using c
● 有没有什么轮子可以管理大堆的binary文件啊？	● Taobao TFS 架构及开源项目
● 调试版链接时间特别长	● 并口驱动的一个问题 (转载)
● 为啥用mmap访问文件的效率高呢？	● 搞大数据那帮人连个quick sort都写不出来
● 【讨论】Linux启动时执行配置文件的顺序 (转载)	● 如何快速保存大块数据（工作中遇到的问题）
● Windows/Linux FTP问题	● 哪个Revision Control不往working目录下塞metadata？
● 问个面试题	● 今天碰见一个高手
● 这个面试题有什么trick？	● netflix也是windows shop吧

相关话题的讨论汇总
话题: 文件话题: linux话题: index话题: 文件大小话题: offset

进入Programming版参与讨论

(共1页)

j******n
发帖数: 108

自己要写一个 inverted list index
先只考虑一个很简单的二级结构
Hash 表(keyword:offset)保存在内存里
offset是指向 index 文件内, 该 keyword 的位置
(如果 index 分为多个文件，还需要一个值指向文件的磁盘位置)
暂时只考虑 index 的读操作的性能，因为读磁盘操作较多
当然希望尽量减少磁盘开销。
关于 linux 的文件系统，有个问题
Linux FS 会尽量把一个文件放在连续的 block 上面
有的 linux 文件大小有上限(2G?)，除此之外，
index 单个文件就是越大越好么？
从概念上，文件的 metadata 在 inode 里，打开一个大文件或是
一个小文件，似乎差别不大。而通过 feek 定位到具体位置，和
当前磁头位置有关：a) 磁头需要先移动文件头，b) 再移动 offset
的位置读取 list。(还是磁头直接移动到 offset 对应的位置？这点
不是很清楚 linux FS系统如何操作) 如果文件大了，b)步似乎就要要慢一些。
不知道有没有人有类似经验或实验，index 单个文件设置成多

m******t
发帖数: 2416

What "linux file system"? There are lots of them.
Different ones have different characteristics.

【在 j******n 的大作中提到】

: 自己要写一个 inverted list index
: 先只考虑一个很简单的二级结构
: Hash 表(keyword:offset)保存在内存里
: offset是指向 index 文件内, 该 keyword 的位置
: (如果 index 分为多个文件，还需要一个值指向文件的磁盘位置)
: 暂时只考虑 index 的读操作的性能，因为读磁盘操作较多
: 当然希望尽量减少磁盘开销。
: 关于 linux 的文件系统，有个问题
: Linux FS 会尽量把一个文件放在连续的 block 上面
: 有的 linux 文件大小有上限(2G?)，除此之外，

(共1页)

进入Programming版参与讨论

相关主题
● netflix也是windows shop吧	● 【讨论】Linux启动时执行配置文件的顺序 (转载)
● JavaScript is eating the world, JSON is replacing xml.	● Windows/Linux FTP问题
● 老话题：旧硬盘如何处理？ (转载)	● 问个面试题
● 文件上传是存在硬盘上，还是存在数据库中？	● 这个面试题有什么trick？
● 文件大小疑惑	● file modification questions in linux using c
● 有没有什么轮子可以管理大堆的binary文件啊？	● Taobao TFS 架构及开源项目
● 调试版链接时间特别长	● 并口驱动的一个问题 (转载)
● 为啥用mmap访问文件的效率高呢？	● 搞大数据那帮人连个quick sort都写不出来

相关话题的讨论汇总
话题: 文件话题: linux话题: index话题: 文件大小话题: offset

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天