- r+ ?; J( b' E. D1 k! n(不久前,和@范卫锋 聊天,谈到我们作为技术的外行,怎么去了解一些基本的互联网知识,于是计划将一个外行人对技术的理解,写下来。某些概念和原理的解释可能不太准确,另外和投资没有直接关系,供其他转行、跨行同学参考。)
' ^5 }. w/ p% V5 }3 v+ V
, G/ q, Y" N1 V/ O# A# v. s第一篇:带宽常识 我家是10兆的宽带,上网为什么巨慢?
( C0 W+ E/ s+ M0 Y+ Z. A5 V: k+ k
6 Q$ N1 L% y' {7 h! ?
& t9 y8 q+ G% Y- a, y5 l( Q/ \如果问题是“我们小区里面是双向10车道,为什么上班路上还是堵车呢?”答案很明显,小区不堵车,但我们的上班地点,出了小区,还得老远的跑到中心区CBD去。你家里的10兆宽带(如果有的话),只是从你家到网络接入商的带宽,不等于到所有地方都是这个速度。
' V# F+ A: O; ~ U- z* V7 o9 }9 v, w$ C& y) S+ ]; h
& b. Q6 i9 u* _
: r1 }) I4 K Y
8 q: f* B6 g* Y上网快慢,涉及到几个问题:你的电脑;你的网络接入商;你希望使用的互联网服务(简单理解为要访问的目标网站吧);目标网站的系统;目标网站所在网络环境。 + F3 ^" f# G5 `& y, i
- X) M* ^& q) Z) d# G" B# p2 L% y4 i" l- `: y
1,跑车还是拖拉机?
. E y! R- N+ @" a1 k
$ Q8 u1 e" E1 @2 l( A, A
" N) a+ K1 D* G1 U/ u" ~# a影响网速的因素,首先要看,你的电脑配置是不是太落后,是不是中了木马、流氓软件等。是不是同时使用了太多耗费带宽的服务,比如看视频,下载大文件等。
5 O9 M1 j& m/ [7 \0 I. w9 ^0 e
1 x. d1 F6 n m% g* h. ?: z+ C
: ?% z! Y- k' B; t& t+ k/ I
1 o% t; T8 A( [4 j. w2,网络接入商
3 N3 X1 j4 m) w$ d3 A. o; G6 ^* |
% G/ C6 u7 n3 Q& u& A9 [+ e# }$ q1 M
简单来说,就是能牵线到你家里,然后让你的电脑上网的那个公司(现在也有无线的方式)。由于历史的原因,以前只有中国电信能为普通用户提供这种服务,所以现在最大的接入商,仍然是中国电信和中国网通。其他大大小小的各种接入商(比如长城宽带、E家宽、歌华有线等),可以看作是前两者的分包商。这些可以统称ISP (Internet Service Provider),互联网服务提供商。- D7 P, f3 G6 {+ Y# t$ t/ F9 u s
. W& d/ ?+ g) m- A6 o6 t1 u2 d& M2 G; }4 w
3,目标网站1 y. X. u1 m% N& v2 A
; K% G4 t2 G/ g! h/ a
, n! b R% F, y1 s9 a* v作为上班一族的你,中心区是你经常去的目的地;而上网的话,目标网站的服务器在哪里?同样由于历史原因,绝大多数都在中国电信或者中国网通的机房里,也有部分公司,通过从电信、网通租赁一些带宽,自建了机房,再向外提供服务。这些都叫IDC(Internet Data Center),即互联网数据中心。. B/ U- S, E3 D S* {$ J9 E
# \- K# e f- ^8 _' I4 z6 L$ z+ G. L( e! A; ]+ T2 x/ _
4,目的地是小区还是中心区?6 `5 u# R- a4 V
' ^4 m6 {/ a! I# R0 q& h M
9 r$ A3 v; A0 x& | N: a, n
假设你的接入商是长城宽带(简称长宽),10兆(M)入户。或者,从你家到长宽的骨干网,的确有10兆(也就是小区内的10车道)。问题是,你经常访问的是新浪、网易以及雪球等网站,而这些网站的服务器不在长宽。于是,如果长宽的用户越来越多,而长宽与电信、网通之间的接口带宽没有相应增加的话,网速就越来越慢。所以,即使是相同的带宽标准,不同的接入商,与你实际使用到的带宽差别非常大。这里不得不为电信、网通做一下广告,他们的ADSL以及专线等方式要比其他接入商靠谱。% h, i) q. _9 T
0 w9 u7 ^& x, S2 n; m( Q2 X/ ~9 h; J' V& m7 O
5,上班高峰期# @* Y7 M7 b3 e8 \$ B- j% f
* _( N" }9 I9 \9 ^, |* W
4 Z# \$ c0 ]; `, Z
虽然,网络接入商,不断的增加自己与电信、网通等骨干网之间的带宽(要钱的),也就是将小区出去的路修得宽一点。但是仍然难解决上班高峰期,大家一起上路的问题。所以,很多你会发现,早上起来觉得网速很快,但到晚上就不灵了。因为对小区宽带用户来说,晚上是使用高峰期。
' A1 s" ?. H9 L z9 m8 Q% b5 L7 P7 H9 `9 K$ k+ H8 s
$ `' Q$ j( z0 C/ O s _1 p6,小车还是火车?0 j! I& v5 P1 z0 u+ P8 R! V" E
: Y8 p3 Y! j/ X$ ~
6 u$ J1 O: I6 c. O! N( K3 e
如果你的小区有1000辆车需要开到中心区,为了不堵车,是不是得修一条1000车道宽的公路呢?当然不是,因为1000辆车不是并排一起走的,每辆车只占几米长的一小截路面,所以10车道的公路就足够了。4 | b; }+ f! W; B3 a, E
) e: A0 d3 K$ Q8 }& Z! [8 c
9 n- Y, }- a9 w, ?& ]! q但,如果这些车不是轿车,而是火车(每列车所占的路面很长),恐怕就得要几百条车道,才不会堵车了。
: \$ [) o3 x; p' q
, m; v& \$ q K9 N% ^ {2 q8 d! ~& j
+ c s! ~! u8 _0 K# V1 I9 R同理,假设小区里有1000户人家开设了10兆接入,接入商并非提供10兆X1000的总出口带宽。因为,多数人的上网行为,比如浏览网页,仅在打开页面极短的时间内产生高流量,而且也不是所有用户约好了一起刷页面,可以实现错峰。如果是QQ聊天之类的活动,所占的带宽也非常小。也就是说,你的10兆带宽,多数时间是闲置的。
$ A5 b7 L4 Z- \
/ f. `( y( Z# l8 M8 _! _, ^9 t( A- n" X% s4 y
因此,网络接入商不会按理论最大值来配备带宽。如果平时大家都是开小车(浏览网页、聊天)还好,如果开火车,就容易堵了。进行大文件的下载(包括在线看视频)就像开火车,特别是使用P2P的下载软件(比如迅雷、电驴),因为带宽长时间被占据,如果接入商的总带宽冗余不多,少量的火车就会将出口挤爆。
3 `5 y5 H7 n, H/ Q/ h" {5 J8 {" b
$ |' s% j2 `) t! L+ i( ]0 a
9 w4 j# z% `, y7 Z
: q- k3 G2 Z; F! g+ p' f& `7,目标网站的系统
* g2 \* w' {0 O! b( j* K. P
$ ?2 m5 h3 Q1 {
: ?) a+ u) t& p6 F" v l4 _( X你一路飞车到了中心区,但是里面塞满了车,你只能在路口排队等。用户所能感受的网速,与目标网站所提供的服务及其质量关系极大,主要是受网站的架构、数据库读写、缓存技术、以及前端页面的编码、以及访问压力等影响。一般来说,静态页面抗压能力要比动态页面强很多,换个意思是,同样的条件下,静态页面通常比动态页面快。静态页面(或者是应该静态化的页面)可以简单理解为,所有人看到的几乎都是一样的内容,比如新闻页面;动态页面每个人看到的都是各不相同,比如微博自己的首页,或者对更新频率要求在秒以内的页面。
) b" X% c+ N1 H. @- k/ ~1 F/ N$ B2 t/ [
]3 U5 _! m4 [, G
; l4 `) T! l6 [2 m1 E: U- Q- L+ l& X6 G8 d0 `# j( _) A
8,目标网站的网络环境
/ r. [$ i0 K. V6 \
) R6 I: q P( Z' z9 k" L* F2 J- m4 F# z6 D
由于各种原因,中国主要的基础网络提供商电信和联通(前网通)之间,互联互通还存在很大障碍,另外还有教育网、金桥网、中国移动等各种网络环境。如果一台服务器,放在网通的机房,电信的用户跨网访问可能较慢,反之亦然。所以,不少网站将服务器放到双线、甚至BGP机房,以解决用户跨网访问的问题。: n, r4 x. l2 D' h) Z
4 n+ @' E. E1 F+ _: w8 V
另外,由于中国到境外的出口总带宽瓶颈以及其他原因,国内用户使用境外的互联网服务,速度明显受到影响,哪怕目标服务器是在香港。0 ^4 _7 g4 ? i( r
8 f: w+ c1 U' R' U" C
9,网络分发和加速服务# o1 Y" @6 e- t! ~' R: r" h
0 X$ k/ ^; N$ a7 |0 C# y- p$ {5 _& D. Y3 F- |
( R) v- H- Y1 y
这个不是针对单个上网用户的服务,是网络内容服务商(简称网站运营方吧),通过网络分发和加速服务,部分地解决用户的访问瓶颈问题。也就是CDN(Content Delivery Network)。0 K( {# |- `! p! k
8 n6 a9 d6 A1 g# O0 W: z5 Y
再看之前的例子,假设目标网站的服务器,是放在北京联通下某个机房,一个海南的电信接入的用户去请求,路途遥远。虽然在光速传输上,从北京到海南的物理距离所耗费的时间几乎可以忽略。但是事实上,由于各个接入商、各地网络环境、跨城市骨干网总带宽、以及互联互不通等问题,确实存在瓶颈。
' B# m; T. q0 s- y8 [ ]# g0 G; W/ [; w0 n- Q# B; O) V
0 h! d* K# }3 F$ ` [% m9 v- m$ W
于是有的公司(蓝汛、网宿科技、世纪互联等),在全国各地租用(或者自建)当地的机房和网络,架设了自己的全国分发系统。目标网站最终的服务器可能还是在北京,但是将内容通过他们的CDN网络向全国(全世界)分发,于是,海南的用户,直接请求当地最近的服务器的镜像数据,比以前要快很多。而别的同样在海南的其他用户,需要相同的内容时,也直接从本地最近机房读取。CDN的方式,既提供了访问速度,也节约了带宽成本。有的带宽虚耗大户,干脆组建自己的CDN网络。世界上最大的CDN服务提供商是Akamai(NASDAQ:AKAM)。
6 v! u7 S; |3 [0 I3 e9 n9 ]7 N+ A+ I, j1 h; o) m8 m& I8 R: |% L) A
: U+ t, F- z6 }1 _! l. Q% `这方式可以理解为,全国人民本来要去北京朝圣,一睹老人家遗容。按传统的方式,即使将飞机、轮船、火车、手推车等所有交通工具用上,再将北京整个城市腾空来接待,10几亿人民不知道排队到何年何月。现在有个CDN公司,将尸体一摸一样地复制了几万份,分发到全国各地,甚至某些乡镇都有。于是,人民无需背井离乡、长途跋涉远赴京城,奔丧之需又丝毫不受影响。
' w/ O8 M8 l3 L) }5 M( X- C: u6 o& z. l0 h3 s: F
0 l* p. L, N2 N, l
10,动态CDN
6 K. X0 p5 i; B
8 E) p. E4 k( w8 I+ Z' O" X/ W
7 ]3 D6 a5 d, b前面说的CDN目前主要使用在更新频率很低(甚至几乎不作更新)的静态(静态化)内容上。比如,上面的遗体,复制几万次而不影响大家哀悼,是因为复制品和原品一摸一样(至少人民感知不到区别)。如果是个活人,身体、穿着、神态等天天在变,要保证复制品质量的话,就得不停的更新,那样会导致很多运输在途的复制品变成废品。现在的动态CDN技术,能将复制频率以及向全国分发的时间,缩短到用户无法感知的程度,已经有部分公司尝试使用(价格昂贵)。
g1 M5 X F* j! o, Q5 \
8 Z; Q$ z* X" b( }0 G
$ s1 K9 O& K1 I a8 ~11,带宽的单位
4 w0 H1 ?6 H6 w: t* y9 E! v: Y ?" R, N6 ~- z/ C Z, u
+ x! _+ X2 a O7 l( |* y假设上面说的问题都解决了,家里10兆(10M)的带宽,下载东西时,你会发现,怎么最多也只是1.25M/秒?那是因为,服务商说的带宽(字节)单位,是bit,而我们电脑上,使用的单位是byte。1byte=8bit,需要将他们的说的数字,除以8。电脑里显示某个文件的大小时候,使用的也是byte。(雪球 梁剑)
& {' H$ W" _: ~% [6 }4 r/ V7 \# F8 l/ i0 I, [' w
& y M9 G) X1 `+ I+ V
2011-12-29 18:02 来自雪球 9 g: {. `) X! D: q+ U& b' V X
|