4 m4 h+ e# u& V7 \# c' G4 T
(不久前,和@范卫锋 聊天,谈到我们作为技术的外行,怎么去了解一些基本的互联网知识,于是计划将一个外行人对技术的理解,写下来。某些概念和原理的解释可能不太准确,另外和投资没有直接关系,供其他转行、跨行同学参考。)
2 O4 W- [# v8 O& E* @ q/ H& h6 d$ O$ l n6 s
第一篇:带宽常识 我家是10兆的宽带,上网为什么巨慢?& G: k9 S7 J7 y! ^
1 \( [; k+ L# L2 Y8 p
/ S s! v, N" ?; n# k; D6 w如果问题是“我们小区里面是双向10车道,为什么上班路上还是堵车呢?”答案很明显,小区不堵车,但我们的上班地点,出了小区,还得老远的跑到中心区CBD去。你家里的10兆宽带(如果有的话),只是从你家到网络接入商的带宽,不等于到所有地方都是这个速度。+ R( Z0 }8 x4 r( t2 }: ?: X
! B( }# t8 s, A! h/ K) _; H) r" d
1 ~. @& P) @$ u5 [& X4 d$ x) ]& b1 W* @7 p8 e, T6 k" t6 I; ?# M/ \
9 q9 P- k0 d, J6 r5 K+ r
上网快慢,涉及到几个问题:你的电脑;你的网络接入商;你希望使用的互联网服务(简单理解为要访问的目标网站吧);目标网站的系统;目标网站所在网络环境。 " Z4 L& f6 ]/ n2 F6 u
6 P, U1 b, R( }9 W3 p r5 M ?3 R, j/ P; p2 F7 o G W- m8 f
1,跑车还是拖拉机?
; y( ]' v7 [1 \% f0 L6 y' m0 v/ m. b4 v8 A2 u! X1 J
& p0 P/ m' r' W) W! W) }影响网速的因素,首先要看,你的电脑配置是不是太落后,是不是中了木马、流氓软件等。是不是同时使用了太多耗费带宽的服务,比如看视频,下载大文件等。
: u. m! \1 c0 }% O; B% O% a
) Q, d1 S% P4 m6 g9 d' i! h) U: n, O; A
$ e' g7 F; a0 J1 ^: T% K2,网络接入商
8 c$ Y1 w. R+ i2 B6 c W3 q3 c. |* V. f( F6 R; X7 j/ b% M' b% O# s" `
% z" A) x: X( e9 O简单来说,就是能牵线到你家里,然后让你的电脑上网的那个公司(现在也有无线的方式)。由于历史的原因,以前只有中国电信能为普通用户提供这种服务,所以现在最大的接入商,仍然是中国电信和中国网通。其他大大小小的各种接入商(比如长城宽带、E家宽、歌华有线等),可以看作是前两者的分包商。这些可以统称ISP (Internet Service Provider),互联网服务提供商。, @ a( S: A. j1 T, T
. w* [0 e& s4 h2 M: P; y$ [" J
1 ]4 d3 C, Z# _9 C$ A" c5 {' ^3,目标网站0 j# n; w$ E8 V4 W: x- F5 ]+ i
9 [* P4 m/ o" s
7 ^- I! B" \* t6 V" N' ^# Y作为上班一族的你,中心区是你经常去的目的地;而上网的话,目标网站的服务器在哪里?同样由于历史原因,绝大多数都在中国电信或者中国网通的机房里,也有部分公司,通过从电信、网通租赁一些带宽,自建了机房,再向外提供服务。这些都叫IDC(Internet Data Center),即互联网数据中心。; Y9 o% c( L2 O X z
8 N+ b+ F [5 r8 v! w" F. N
2 k. }( w2 N: U) O0 y( w4,目的地是小区还是中心区?; G) r+ `- L% q: T! N! r1 F
M9 f) Q) @, I, a3 x) m
: [. a; A0 F( T1 x% z: o
假设你的接入商是长城宽带(简称长宽),10兆(M)入户。或者,从你家到长宽的骨干网,的确有10兆(也就是小区内的10车道)。问题是,你经常访问的是新浪、网易以及雪球等网站,而这些网站的服务器不在长宽。于是,如果长宽的用户越来越多,而长宽与电信、网通之间的接口带宽没有相应增加的话,网速就越来越慢。所以,即使是相同的带宽标准,不同的接入商,与你实际使用到的带宽差别非常大。这里不得不为电信、网通做一下广告,他们的ADSL以及专线等方式要比其他接入商靠谱。
% n+ Q5 a1 B& F& M( `, j" `6 y% g; t8 o% C. n% s( F, |$ i0 g
* \1 M0 @6 ^0 _8 Z# k2 l+ r. d8 l5,上班高峰期3 {4 [. i# c. B3 l! o. G& |
2 G& Z# D3 q& _# }1 u( n+ [% u" e- m h# [1 L3 e, r
虽然,网络接入商,不断的增加自己与电信、网通等骨干网之间的带宽(要钱的),也就是将小区出去的路修得宽一点。但是仍然难解决上班高峰期,大家一起上路的问题。所以,很多你会发现,早上起来觉得网速很快,但到晚上就不灵了。因为对小区宽带用户来说,晚上是使用高峰期。8 A; \' O) H5 j) P1 f
" e8 v! x! _ _% m, c
% e8 b6 n2 X0 k8 k% k+ {
6,小车还是火车?0 j7 ^% m9 r. L: u4 X% |
O) v+ I; ]# n3 W) E4 u
% G& U1 c# l/ N如果你的小区有1000辆车需要开到中心区,为了不堵车,是不是得修一条1000车道宽的公路呢?当然不是,因为1000辆车不是并排一起走的,每辆车只占几米长的一小截路面,所以10车道的公路就足够了。
" C* Y) {# m" D+ r$ V0 h7 h8 A% n6 P, E* }; Z7 a( m: d
6 r9 v9 a5 e' c. |1 Z q$ L
但,如果这些车不是轿车,而是火车(每列车所占的路面很长),恐怕就得要几百条车道,才不会堵车了。
/ D* t, K- }) R" n
; u& G0 \2 w% P0 |: X8 M/ [
" p% K8 l/ ^9 W$ g& ?& ]- u" j同理,假设小区里有1000户人家开设了10兆接入,接入商并非提供10兆X1000的总出口带宽。因为,多数人的上网行为,比如浏览网页,仅在打开页面极短的时间内产生高流量,而且也不是所有用户约好了一起刷页面,可以实现错峰。如果是QQ聊天之类的活动,所占的带宽也非常小。也就是说,你的10兆带宽,多数时间是闲置的。
0 V3 L3 M, M' g# q: x
, T& r; J3 p7 h0 Y$ s' K7 o0 S6 L# `
) j$ s3 [* L# I% p# X. N$ q2 ]因此,网络接入商不会按理论最大值来配备带宽。如果平时大家都是开小车(浏览网页、聊天)还好,如果开火车,就容易堵了。进行大文件的下载(包括在线看视频)就像开火车,特别是使用P2P的下载软件(比如迅雷、电驴),因为带宽长时间被占据,如果接入商的总带宽冗余不多,少量的火车就会将出口挤爆。) f. z! S/ G' D
9 v1 n& t6 U+ \& j% G
6 ^6 a+ ]. j3 G8 _: X# q
( Y6 _% Q( L( u9 p( v7,目标网站的系统; K. w8 Q8 c a
9 U, ~, N! U) ]/ Q }% j, B5 h! s6 l! i+ l$ o
你一路飞车到了中心区,但是里面塞满了车,你只能在路口排队等。用户所能感受的网速,与目标网站所提供的服务及其质量关系极大,主要是受网站的架构、数据库读写、缓存技术、以及前端页面的编码、以及访问压力等影响。一般来说,静态页面抗压能力要比动态页面强很多,换个意思是,同样的条件下,静态页面通常比动态页面快。静态页面(或者是应该静态化的页面)可以简单理解为,所有人看到的几乎都是一样的内容,比如新闻页面;动态页面每个人看到的都是各不相同,比如微博自己的首页,或者对更新频率要求在秒以内的页面。
, j1 u2 j) J; Y( T( I; G6 w0 D/ J
: D- e* \& U, c- h& ]) B& g% Y* x0 x
8,目标网站的网络环境
: ]; \) |/ M/ ]8 F% p
1 m* n5 q' `' Z; h+ j: W6 \; `6 l' ^" A0 r1 F
由于各种原因,中国主要的基础网络提供商电信和联通(前网通)之间,互联互通还存在很大障碍,另外还有教育网、金桥网、中国移动等各种网络环境。如果一台服务器,放在网通的机房,电信的用户跨网访问可能较慢,反之亦然。所以,不少网站将服务器放到双线、甚至BGP机房,以解决用户跨网访问的问题。
& v$ `( s& D- u# X2 X4 v5 B4 Z3 s7 r) M. U. Y) b) V% |
另外,由于中国到境外的出口总带宽瓶颈以及其他原因,国内用户使用境外的互联网服务,速度明显受到影响,哪怕目标服务器是在香港。) @' ^( }( t3 g6 }; ^) | B7 h
! z$ w3 y$ k: d* u3 f/ a9,网络分发和加速服务! r% t9 Q8 \8 ]) |- l* l
3 h3 x8 c3 R5 ]: ]7 |9 @" I3 f& ~8 n! x' d* n/ f P/ s
$ L& T( r& R8 r1 r" O; y这个不是针对单个上网用户的服务,是网络内容服务商(简称网站运营方吧),通过网络分发和加速服务,部分地解决用户的访问瓶颈问题。也就是CDN(Content Delivery Network)。
6 C9 ~" k5 Q3 U6 G$ V$ f/ g* d& y* J, h1 n) u9 h
再看之前的例子,假设目标网站的服务器,是放在北京联通下某个机房,一个海南的电信接入的用户去请求,路途遥远。虽然在光速传输上,从北京到海南的物理距离所耗费的时间几乎可以忽略。但是事实上,由于各个接入商、各地网络环境、跨城市骨干网总带宽、以及互联互不通等问题,确实存在瓶颈。
4 O9 p% l" m+ l6 ^8 n- R9 O: a3 y9 M- y/ g$ g( h9 I( f- h
9 F& z' ?+ t0 d于是有的公司(蓝汛、网宿科技、世纪互联等),在全国各地租用(或者自建)当地的机房和网络,架设了自己的全国分发系统。目标网站最终的服务器可能还是在北京,但是将内容通过他们的CDN网络向全国(全世界)分发,于是,海南的用户,直接请求当地最近的服务器的镜像数据,比以前要快很多。而别的同样在海南的其他用户,需要相同的内容时,也直接从本地最近机房读取。CDN的方式,既提供了访问速度,也节约了带宽成本。有的带宽虚耗大户,干脆组建自己的CDN网络。世界上最大的CDN服务提供商是Akamai(NASDAQ:AKAM)。' J' E. ?+ J, S4 x9 ~. N9 M
5 q! G9 J/ Z9 P
7 x) D- }, S9 u; X3 }1 ?0 f这方式可以理解为,全国人民本来要去北京朝圣,一睹老人家遗容。按传统的方式,即使将飞机、轮船、火车、手推车等所有交通工具用上,再将北京整个城市腾空来接待,10几亿人民不知道排队到何年何月。现在有个CDN公司,将尸体一摸一样地复制了几万份,分发到全国各地,甚至某些乡镇都有。于是,人民无需背井离乡、长途跋涉远赴京城,奔丧之需又丝毫不受影响。6 S, G4 }, W& m. i
& n B3 V8 |* Q/ ]. U
, @- q0 a1 h: h* z# A
10,动态CDN9 L* D- d4 y* W; D4 x3 |4 \
" j9 W% Y5 O5 A/ O% Q1 v8 t) }1 l. u
前面说的CDN目前主要使用在更新频率很低(甚至几乎不作更新)的静态(静态化)内容上。比如,上面的遗体,复制几万次而不影响大家哀悼,是因为复制品和原品一摸一样(至少人民感知不到区别)。如果是个活人,身体、穿着、神态等天天在变,要保证复制品质量的话,就得不停的更新,那样会导致很多运输在途的复制品变成废品。现在的动态CDN技术,能将复制频率以及向全国分发的时间,缩短到用户无法感知的程度,已经有部分公司尝试使用(价格昂贵)。) u. m/ H/ ?* Z* X1 X1 `2 ]
9 C D0 l- L# J# N) Q% [0 i* v! a3 {
: }6 l5 |! w* U
11,带宽的单位6 G" B$ f4 m: e: T
6 P% r% e! t$ _* X
' F7 o$ b# {" z- s+ _# ^假设上面说的问题都解决了,家里10兆(10M)的带宽,下载东西时,你会发现,怎么最多也只是1.25M/秒?那是因为,服务商说的带宽(字节)单位,是bit,而我们电脑上,使用的单位是byte。1byte=8bit,需要将他们的说的数字,除以8。电脑里显示某个文件的大小时候,使用的也是byte。(雪球 梁剑). ^( ~) ^3 n1 r7 u: ]
. D: P# J; Z0 k$ T4 u
: m0 J; `' }3 g! C; I( b. {3 b
2011-12-29 18:02 来自雪球 9 p. O y: T% t# T
|