) D( M% j! q! n8 s(不久前,和@范卫锋 聊天,谈到我们作为技术的外行,怎么去了解一些基本的互联网知识,于是计划将一个外行人对技术的理解,写下来。某些概念和原理的解释可能不太准确,另外和投资没有直接关系,供其他转行、跨行同学参考。)
1 B9 B' }% C( ?7 X7 W6 \+ E$ o! l( x
第一篇:带宽常识 我家是10兆的宽带,上网为什么巨慢?. F" x1 ]% V. u3 A
) \0 \, J+ L. n' b2 q7 [" p8 [$ V5 f% Q3 S; }/ X
如果问题是“我们小区里面是双向10车道,为什么上班路上还是堵车呢?”答案很明显,小区不堵车,但我们的上班地点,出了小区,还得老远的跑到中心区CBD去。你家里的10兆宽带(如果有的话),只是从你家到网络接入商的带宽,不等于到所有地方都是这个速度。2 {( s+ ? i4 ~4 Y* ]* d( y: H
( v) {- g8 w c7 v+ H! D' ~5 u9 s) j9 G. s- s
2 q, _" o2 @0 I6 Q7 f
9 Y$ ?+ ]* l. A上网快慢,涉及到几个问题:你的电脑;你的网络接入商;你希望使用的互联网服务(简单理解为要访问的目标网站吧);目标网站的系统;目标网站所在网络环境。 7 D' e. I6 U5 U1 j+ `
+ \! {& T& f+ Q9 R2 X$ t' N# ~
* H3 g* M# b. u$ E. e7 y
1,跑车还是拖拉机?3 l2 J9 l2 S4 b" E
3 y! Y/ l' u0 Q
9 R: J" M0 j! d. b* r! W
影响网速的因素,首先要看,你的电脑配置是不是太落后,是不是中了木马、流氓软件等。是不是同时使用了太多耗费带宽的服务,比如看视频,下载大文件等。) ]8 D* @7 y- p5 o- i
6 a! \) E# J$ Q: J M/ g3 F
9 X! q8 X' Z% R2 H! T0 E& g7 l# ]# f" Z; C
2,网络接入商0 f( F2 D& t' @% X! M: {# y$ u
: v$ d+ {* u( Z# u' T
- Y4 P) X' ^ f6 o8 O! k7 `. t简单来说,就是能牵线到你家里,然后让你的电脑上网的那个公司(现在也有无线的方式)。由于历史的原因,以前只有中国电信能为普通用户提供这种服务,所以现在最大的接入商,仍然是中国电信和中国网通。其他大大小小的各种接入商(比如长城宽带、E家宽、歌华有线等),可以看作是前两者的分包商。这些可以统称ISP (Internet Service Provider),互联网服务提供商。
. X, H0 J$ F+ ]7 N+ {" R2 o0 D% B9 i3 |1 T3 j' Q: A* C# J4 U
) ]6 j# [% Q! o, a7 J2 ]
3,目标网站
2 g8 c3 a4 `8 b e7 ~4 d1 l: s2 J
8 {2 w* i& l, _$ ^# r9 T3 `3 i7 j6 n4 n
作为上班一族的你,中心区是你经常去的目的地;而上网的话,目标网站的服务器在哪里?同样由于历史原因,绝大多数都在中国电信或者中国网通的机房里,也有部分公司,通过从电信、网通租赁一些带宽,自建了机房,再向外提供服务。这些都叫IDC(Internet Data Center),即互联网数据中心。
+ U Q: Y7 m. f8 @+ y% M3 S5 S
5 [ g4 b! ~. ?5 ?' T6 r, k! u
& W& C( w3 p+ }+ P; r, v5 n4,目的地是小区还是中心区?
* W& C4 k/ `# O+ U1 j# r
! G2 }% ~( R; ]+ N2 q
3 I/ d1 T6 i( {. K( l假设你的接入商是长城宽带(简称长宽),10兆(M)入户。或者,从你家到长宽的骨干网,的确有10兆(也就是小区内的10车道)。问题是,你经常访问的是新浪、网易以及雪球等网站,而这些网站的服务器不在长宽。于是,如果长宽的用户越来越多,而长宽与电信、网通之间的接口带宽没有相应增加的话,网速就越来越慢。所以,即使是相同的带宽标准,不同的接入商,与你实际使用到的带宽差别非常大。这里不得不为电信、网通做一下广告,他们的ADSL以及专线等方式要比其他接入商靠谱。, x8 Z8 x4 u# ~$ \
8 Q( M" z2 [5 a% C6 `1 K5 h
' r( L V8 `$ C; m) G5,上班高峰期
4 c6 n7 O1 m$ O6 K; D6 K
0 x3 _+ x4 y8 u6 h7 s1 g' Y2 t) w7 V" ]( A* M+ u
虽然,网络接入商,不断的增加自己与电信、网通等骨干网之间的带宽(要钱的),也就是将小区出去的路修得宽一点。但是仍然难解决上班高峰期,大家一起上路的问题。所以,很多你会发现,早上起来觉得网速很快,但到晚上就不灵了。因为对小区宽带用户来说,晚上是使用高峰期。
0 k$ ]' z% d/ N/ m Y2 q
& e3 G9 G+ P5 J9 H$ u, ], l# ^7 U* o5 i3 m! d/ y( U
6,小车还是火车?" @2 B$ Q5 l6 c' P; S9 z( h- u0 J
* m+ h) |" P, q4 }4 j; W: D
; M Z5 a1 e/ u0 @; x l如果你的小区有1000辆车需要开到中心区,为了不堵车,是不是得修一条1000车道宽的公路呢?当然不是,因为1000辆车不是并排一起走的,每辆车只占几米长的一小截路面,所以10车道的公路就足够了。
9 b7 i1 E7 y4 o/ e* f5 }, U# R0 _ z u# ~7 |7 p7 F! [
# i: d: u& K9 O* \1 B
但,如果这些车不是轿车,而是火车(每列车所占的路面很长),恐怕就得要几百条车道,才不会堵车了。
; M9 Y0 N% J7 ^ ?% R4 f5 x, b, P' i& H% y
( Q, T/ G" V6 X8 E6 r2 B同理,假设小区里有1000户人家开设了10兆接入,接入商并非提供10兆X1000的总出口带宽。因为,多数人的上网行为,比如浏览网页,仅在打开页面极短的时间内产生高流量,而且也不是所有用户约好了一起刷页面,可以实现错峰。如果是QQ聊天之类的活动,所占的带宽也非常小。也就是说,你的10兆带宽,多数时间是闲置的。
8 h9 m* ]& R6 O; {5 p3 w( D9 U7 w9 L6 ?0 O# ^* c& T
. G+ {5 ?! j1 e$ f, s9 `( d7 S
因此,网络接入商不会按理论最大值来配备带宽。如果平时大家都是开小车(浏览网页、聊天)还好,如果开火车,就容易堵了。进行大文件的下载(包括在线看视频)就像开火车,特别是使用P2P的下载软件(比如迅雷、电驴),因为带宽长时间被占据,如果接入商的总带宽冗余不多,少量的火车就会将出口挤爆。
, K ^' Z, m0 p5 h! |# i: E$ K: G; Y+ z; z
, T' S5 b8 B0 D! A
7 l$ V" l! o! f7 d7,目标网站的系统1 L, S! {8 X" v
% X* ~3 n* d, A1 F# G0 N1 K& I9 t$ f7 [' T
你一路飞车到了中心区,但是里面塞满了车,你只能在路口排队等。用户所能感受的网速,与目标网站所提供的服务及其质量关系极大,主要是受网站的架构、数据库读写、缓存技术、以及前端页面的编码、以及访问压力等影响。一般来说,静态页面抗压能力要比动态页面强很多,换个意思是,同样的条件下,静态页面通常比动态页面快。静态页面(或者是应该静态化的页面)可以简单理解为,所有人看到的几乎都是一样的内容,比如新闻页面;动态页面每个人看到的都是各不相同,比如微博自己的首页,或者对更新频率要求在秒以内的页面。
! |: G: Q% v# e2 _6 G, Z& p5 K& B7 ?" F6 {( c
: |4 r; h9 I- x; l; J! A L
1 g/ t) ?+ o+ D0 a* Z$ j8 x$ Z
8,目标网站的网络环境1 c0 Z# ~" e5 w, J7 \
0 e+ ?( `1 u3 c% z2 b8 Z
* l( r/ U+ k+ @4 \$ z& @由于各种原因,中国主要的基础网络提供商电信和联通(前网通)之间,互联互通还存在很大障碍,另外还有教育网、金桥网、中国移动等各种网络环境。如果一台服务器,放在网通的机房,电信的用户跨网访问可能较慢,反之亦然。所以,不少网站将服务器放到双线、甚至BGP机房,以解决用户跨网访问的问题。. ?; M/ Y2 Q& h/ {' M; U
3 Y( j! P7 J0 j) I
另外,由于中国到境外的出口总带宽瓶颈以及其他原因,国内用户使用境外的互联网服务,速度明显受到影响,哪怕目标服务器是在香港。# d; H* ?; e. m: |& w* {
$ C$ H' Z: N# [1 R8 l+ X
9,网络分发和加速服务: I7 T5 y; m3 [% ~; p7 \7 |8 j
8 E l9 _5 i0 f3 w
' ^2 @) A- s2 K! N( D* A* ]# a l, M: T. Y5 m
这个不是针对单个上网用户的服务,是网络内容服务商(简称网站运营方吧),通过网络分发和加速服务,部分地解决用户的访问瓶颈问题。也就是CDN(Content Delivery Network)。" [% C2 t' Y- o( v
% @5 {: y& R5 k+ P Y3 Y
再看之前的例子,假设目标网站的服务器,是放在北京联通下某个机房,一个海南的电信接入的用户去请求,路途遥远。虽然在光速传输上,从北京到海南的物理距离所耗费的时间几乎可以忽略。但是事实上,由于各个接入商、各地网络环境、跨城市骨干网总带宽、以及互联互不通等问题,确实存在瓶颈。( f7 @6 ^ f& M5 v+ ~" B
* t8 b4 Z& }% m8 B4 p( q; m/ {0 X1 l% ^3 {! W$ d6 c
于是有的公司(蓝汛、网宿科技、世纪互联等),在全国各地租用(或者自建)当地的机房和网络,架设了自己的全国分发系统。目标网站最终的服务器可能还是在北京,但是将内容通过他们的CDN网络向全国(全世界)分发,于是,海南的用户,直接请求当地最近的服务器的镜像数据,比以前要快很多。而别的同样在海南的其他用户,需要相同的内容时,也直接从本地最近机房读取。CDN的方式,既提供了访问速度,也节约了带宽成本。有的带宽虚耗大户,干脆组建自己的CDN网络。世界上最大的CDN服务提供商是Akamai(NASDAQ:AKAM)。
1 A3 D& u* H% j8 N1 ^
1 K) b3 V9 s: D, ^
+ v: `( y4 }3 `这方式可以理解为,全国人民本来要去北京朝圣,一睹老人家遗容。按传统的方式,即使将飞机、轮船、火车、手推车等所有交通工具用上,再将北京整个城市腾空来接待,10几亿人民不知道排队到何年何月。现在有个CDN公司,将尸体一摸一样地复制了几万份,分发到全国各地,甚至某些乡镇都有。于是,人民无需背井离乡、长途跋涉远赴京城,奔丧之需又丝毫不受影响。
' [4 G7 U' B+ a8 B8 y0 x3 N
, P# {1 Z* M- O
, K: n5 T- K! f$ }2 K6 {7 w10,动态CDN7 y* ~& C- @8 g+ k
# R: o" b8 k, s$ |, e, Q+ P2 }
" Z7 @. a5 t F8 R7 B
前面说的CDN目前主要使用在更新频率很低(甚至几乎不作更新)的静态(静态化)内容上。比如,上面的遗体,复制几万次而不影响大家哀悼,是因为复制品和原品一摸一样(至少人民感知不到区别)。如果是个活人,身体、穿着、神态等天天在变,要保证复制品质量的话,就得不停的更新,那样会导致很多运输在途的复制品变成废品。现在的动态CDN技术,能将复制频率以及向全国分发的时间,缩短到用户无法感知的程度,已经有部分公司尝试使用(价格昂贵)。- `/ f4 |" l3 l: Z
) Q3 W1 j2 w9 A1 T' m, ^. q3 G4 u% S: |1 M `6 G" N
11,带宽的单位" D# E% M; [2 f3 n S
' \4 {, x% {/ o$ q8 @/ ^& t' u- }. ?- z9 f
假设上面说的问题都解决了,家里10兆(10M)的带宽,下载东西时,你会发现,怎么最多也只是1.25M/秒?那是因为,服务商说的带宽(字节)单位,是bit,而我们电脑上,使用的单位是byte。1byte=8bit,需要将他们的说的数字,除以8。电脑里显示某个文件的大小时候,使用的也是byte。(雪球 梁剑)4 K+ N8 n" R0 ^0 O5 X
( @" p1 h6 b i( i! v" {. s! @. {
, r' l. h2 d S( ~: n/ r2011-12-29 18:02 来自雪球
a! @$ J$ O3 h |