8 x- h% k" @( _(不久前,和@范卫锋 聊天,谈到我们作为技术的外行,怎么去了解一些基本的互联网知识,于是计划将一个外行人对技术的理解,写下来。某些概念和原理的解释可能不太准确,另外和投资没有直接关系,供其他转行、跨行同学参考。)
' o8 ]8 a) l9 }9 O) [1 l" r g) k
& i) U* X$ U5 C# U4 E第一篇:带宽常识 我家是10兆的宽带,上网为什么巨慢?
9 ^; v: k x- b1 F) H+ E0 Q* [) y/ ~/ B9 ~6 e
X& c) v- L. q0 Q, t) c
如果问题是“我们小区里面是双向10车道,为什么上班路上还是堵车呢?”答案很明显,小区不堵车,但我们的上班地点,出了小区,还得老远的跑到中心区CBD去。你家里的10兆宽带(如果有的话),只是从你家到网络接入商的带宽,不等于到所有地方都是这个速度。8 s: O" \0 c( S" h0 ~) q
6 ^# D5 F5 M. a4 O: v
( K, O; q; ]1 d2 U- S- B3 w1 \; X; u5 ]( a3 F4 e: g- A$ N
' }$ [+ d/ U% B
上网快慢,涉及到几个问题:你的电脑;你的网络接入商;你希望使用的互联网服务(简单理解为要访问的目标网站吧);目标网站的系统;目标网站所在网络环境。
( A! D4 D* }- _- X7 _" ?, b0 q' p* V5 Y6 y* [5 w1 _ H) V
+ E; x `+ t* ^7 v0 }1 B1,跑车还是拖拉机?
, t2 }/ p/ r5 s. s% \3 r1 I- }; r$ Q5 a8 Q9 e0 j- \
! n7 _) H1 O* K- u影响网速的因素,首先要看,你的电脑配置是不是太落后,是不是中了木马、流氓软件等。是不是同时使用了太多耗费带宽的服务,比如看视频,下载大文件等。
# }. b# ^( d+ i+ x2 R2 P! _) S0 @/ [8 h) l* e% o3 g
1 W! y! j( [% w& h
& H$ b3 C' z: e. }( x7 u2 f: i2,网络接入商
7 k* Z- ?# @7 _4 P8 t7 J- E4 T7 A. h! ` g! g, G
- _+ p1 n7 w9 x% t1 d简单来说,就是能牵线到你家里,然后让你的电脑上网的那个公司(现在也有无线的方式)。由于历史的原因,以前只有中国电信能为普通用户提供这种服务,所以现在最大的接入商,仍然是中国电信和中国网通。其他大大小小的各种接入商(比如长城宽带、E家宽、歌华有线等),可以看作是前两者的分包商。这些可以统称ISP (Internet Service Provider),互联网服务提供商。
4 [9 m2 L" Y5 H; n/ r9 j% F+ W4 W# ~! N9 n% E) E
9 a4 T% \" p; N3 q7 l
3,目标网站
' e2 N" u+ H D4 V% J4 |
& p$ h! ?; o9 H- H6 ]0 P4 J* p0 X2 L& \
作为上班一族的你,中心区是你经常去的目的地;而上网的话,目标网站的服务器在哪里?同样由于历史原因,绝大多数都在中国电信或者中国网通的机房里,也有部分公司,通过从电信、网通租赁一些带宽,自建了机房,再向外提供服务。这些都叫IDC(Internet Data Center),即互联网数据中心。" g2 h' ~; ~) B0 r2 r8 s
2 O- K, u) P+ s/ N* \$ S+ h; S9 y. K1 @7 }& C6 T7 k
4,目的地是小区还是中心区?) }9 }$ O6 _ l% P+ f
6 c3 O. I: P' Y! k5 M) M3 @ W/ \; n1 v4 h e, d
假设你的接入商是长城宽带(简称长宽),10兆(M)入户。或者,从你家到长宽的骨干网,的确有10兆(也就是小区内的10车道)。问题是,你经常访问的是新浪、网易以及雪球等网站,而这些网站的服务器不在长宽。于是,如果长宽的用户越来越多,而长宽与电信、网通之间的接口带宽没有相应增加的话,网速就越来越慢。所以,即使是相同的带宽标准,不同的接入商,与你实际使用到的带宽差别非常大。这里不得不为电信、网通做一下广告,他们的ADSL以及专线等方式要比其他接入商靠谱。
; Z* w# m$ M/ A$ R# d, U& `
& [8 }' O9 Q5 i) R* a( @( b
; W5 S, M l3 ]% U5,上班高峰期
8 e! w) G' [9 i9 [$ Z0 D+ U$ ^
* L3 u* l7 u3 e3 G+ p
, N- N1 V- N4 N! f+ H$ @, J$ G虽然,网络接入商,不断的增加自己与电信、网通等骨干网之间的带宽(要钱的),也就是将小区出去的路修得宽一点。但是仍然难解决上班高峰期,大家一起上路的问题。所以,很多你会发现,早上起来觉得网速很快,但到晚上就不灵了。因为对小区宽带用户来说,晚上是使用高峰期。! B$ o5 V- O! M
- k( c- A$ P9 d$ V
" ]$ H( T/ Z; c6,小车还是火车?9 l/ F- v6 {- t* J* o
$ h8 c4 m. a6 s S
8 r: @& e5 H$ o& C! ~如果你的小区有1000辆车需要开到中心区,为了不堵车,是不是得修一条1000车道宽的公路呢?当然不是,因为1000辆车不是并排一起走的,每辆车只占几米长的一小截路面,所以10车道的公路就足够了。% ^4 Q$ k1 U! K1 q. M
3 k/ {: c: m1 n$ K+ e
3 K9 R: ]6 I7 a但,如果这些车不是轿车,而是火车(每列车所占的路面很长),恐怕就得要几百条车道,才不会堵车了。- a% r9 }! a6 W
* g t, X7 O* |
3 T: ~1 b: z* i) }同理,假设小区里有1000户人家开设了10兆接入,接入商并非提供10兆X1000的总出口带宽。因为,多数人的上网行为,比如浏览网页,仅在打开页面极短的时间内产生高流量,而且也不是所有用户约好了一起刷页面,可以实现错峰。如果是QQ聊天之类的活动,所占的带宽也非常小。也就是说,你的10兆带宽,多数时间是闲置的。, y; t. y X. H
' r' E' a1 h1 U8 p0 P# q
% D% h. ?! Q- D% v: z0 w因此,网络接入商不会按理论最大值来配备带宽。如果平时大家都是开小车(浏览网页、聊天)还好,如果开火车,就容易堵了。进行大文件的下载(包括在线看视频)就像开火车,特别是使用P2P的下载软件(比如迅雷、电驴),因为带宽长时间被占据,如果接入商的总带宽冗余不多,少量的火车就会将出口挤爆。
5 {, I, |7 c6 h! j* P6 \" J& T
' b$ F* f" t3 T2 h3 Z5 d7 Y1 H" f
`2 i5 e0 j2 `- W1 H h& X
: e$ ` S& _- ~1 Y; y7,目标网站的系统
, F6 J! ^; H5 N- g- s! F- S, \0 H: _ o
2 T; g5 }! }2 g# O2 [
你一路飞车到了中心区,但是里面塞满了车,你只能在路口排队等。用户所能感受的网速,与目标网站所提供的服务及其质量关系极大,主要是受网站的架构、数据库读写、缓存技术、以及前端页面的编码、以及访问压力等影响。一般来说,静态页面抗压能力要比动态页面强很多,换个意思是,同样的条件下,静态页面通常比动态页面快。静态页面(或者是应该静态化的页面)可以简单理解为,所有人看到的几乎都是一样的内容,比如新闻页面;动态页面每个人看到的都是各不相同,比如微博自己的首页,或者对更新频率要求在秒以内的页面。3 o2 N; K4 Z- h0 Z& m) X
" d1 A* A @% m9 g. L
5 ~6 m6 L4 X* R$ q9 X2 ^; R# A) P5 q! V+ I- a6 ?' g3 p8 t2 }/ R
8,目标网站的网络环境/ }. }: H+ ~% c+ G
8 F6 L3 s! v9 ~1 ]. m( }- K* `
H$ ~ t9 ~0 Q; v, ?. b3 V/ L0 k由于各种原因,中国主要的基础网络提供商电信和联通(前网通)之间,互联互通还存在很大障碍,另外还有教育网、金桥网、中国移动等各种网络环境。如果一台服务器,放在网通的机房,电信的用户跨网访问可能较慢,反之亦然。所以,不少网站将服务器放到双线、甚至BGP机房,以解决用户跨网访问的问题。
) f6 k6 V6 ]" e, g/ }" j, E$ i( m$ X' L6 r4 G) i* S5 ]
另外,由于中国到境外的出口总带宽瓶颈以及其他原因,国内用户使用境外的互联网服务,速度明显受到影响,哪怕目标服务器是在香港。
* [( t: A5 L2 t* A8 D: A' c+ L) V! Y R- n4 o
9,网络分发和加速服务. d" U0 |1 N+ J4 w6 g
" ^2 B5 w2 p. A
: J! F6 i6 u2 r
# R& M5 Y6 l5 E7 M$ v7 `这个不是针对单个上网用户的服务,是网络内容服务商(简称网站运营方吧),通过网络分发和加速服务,部分地解决用户的访问瓶颈问题。也就是CDN(Content Delivery Network)。
4 @- m' e, T( A. n* A( ]8 Z. I1 p( \/ V) e
再看之前的例子,假设目标网站的服务器,是放在北京联通下某个机房,一个海南的电信接入的用户去请求,路途遥远。虽然在光速传输上,从北京到海南的物理距离所耗费的时间几乎可以忽略。但是事实上,由于各个接入商、各地网络环境、跨城市骨干网总带宽、以及互联互不通等问题,确实存在瓶颈。
/ R' I! |5 T2 P% Q7 a( y
( r5 s$ T' W0 N$ X- c$ M% p0 ]2 ?9 P4 j) Q8 B% H
于是有的公司(蓝汛、网宿科技、世纪互联等),在全国各地租用(或者自建)当地的机房和网络,架设了自己的全国分发系统。目标网站最终的服务器可能还是在北京,但是将内容通过他们的CDN网络向全国(全世界)分发,于是,海南的用户,直接请求当地最近的服务器的镜像数据,比以前要快很多。而别的同样在海南的其他用户,需要相同的内容时,也直接从本地最近机房读取。CDN的方式,既提供了访问速度,也节约了带宽成本。有的带宽虚耗大户,干脆组建自己的CDN网络。世界上最大的CDN服务提供商是Akamai(NASDAQ:AKAM)。+ H6 Q' X. y2 k2 l$ Y5 J) `
* ~# `8 |, {; t. e: Q
6 N& Z( }. J: J* u$ U% n
这方式可以理解为,全国人民本来要去北京朝圣,一睹老人家遗容。按传统的方式,即使将飞机、轮船、火车、手推车等所有交通工具用上,再将北京整个城市腾空来接待,10几亿人民不知道排队到何年何月。现在有个CDN公司,将尸体一摸一样地复制了几万份,分发到全国各地,甚至某些乡镇都有。于是,人民无需背井离乡、长途跋涉远赴京城,奔丧之需又丝毫不受影响。
& b6 y7 b0 i& I- z1 n$ \2 d9 N: |1 U
1 T+ {0 H; L5 M( w% g: O% m8 b& u10,动态CDN
( `- q# b3 x) }9 j) G
& R+ |+ o% L( A$ p1 j) Q& r
- s) X3 B! j! x/ p ~前面说的CDN目前主要使用在更新频率很低(甚至几乎不作更新)的静态(静态化)内容上。比如,上面的遗体,复制几万次而不影响大家哀悼,是因为复制品和原品一摸一样(至少人民感知不到区别)。如果是个活人,身体、穿着、神态等天天在变,要保证复制品质量的话,就得不停的更新,那样会导致很多运输在途的复制品变成废品。现在的动态CDN技术,能将复制频率以及向全国分发的时间,缩短到用户无法感知的程度,已经有部分公司尝试使用(价格昂贵)。
: d/ Z0 G V$ O6 A" K7 I' ^
7 a) A* A! s1 e4 x" ^0 m7 h7 q$ C/ {" B: [+ |( s
11,带宽的单位
8 \. e: Q: {% i P- y/ i6 f5 L, k
- V* k& V2 ^: G
假设上面说的问题都解决了,家里10兆(10M)的带宽,下载东西时,你会发现,怎么最多也只是1.25M/秒?那是因为,服务商说的带宽(字节)单位,是bit,而我们电脑上,使用的单位是byte。1byte=8bit,需要将他们的说的数字,除以8。电脑里显示某个文件的大小时候,使用的也是byte。(雪球 梁剑)% i8 c% O& Z3 @8 u
6 o( b; t' C9 w0 c5 Y5 m4 G1 r
; [% ^& T+ V$ T
2011-12-29 18:02 来自雪球 / i; J6 S. Z( A- U
|