| 
  鲜花(0 )   鸡蛋(0 ) | 
 
| 大家关注房价的起落,但究竟应该相信什么数据?Z在这里就自信解释一下究竟怎么解读房价数据。# S* ~, @' h, ?- p0 T; Q 
 - N& R% `+ X; \, A. g; h* q2 p1 N7 N首先,我们要明白,所谓“过去一个月”房价涨 x% 究竟是什么意思。不同的房子,因为地点,尺寸,和其他一些在指标不同,其实涨跌速度各自不一。我们所谓的涨跌幅只是取一个综合值,使得其与各个房子的实际涨跌幅度的误差最小。
 ( e1 v% f- `/ P+ {# @* N, E8 }2 C2 H* j% w  Y
 数学扎实的朋友可以这么理解,假设本城共有n个房子,分别是H1,H2,H3...Hn。
 - @" h/ A/ j# ?7 h9 |0 T它们的价格随时间而变,就设定为P1(t),P2(t),P3(t)...Pn(t)。
 f' y6 S8 g* r  N, |我们现在要求一个贴近的综合价格Pa(t),假设误差以平方之和为标准,那么误差就是:- [" \" z5 d( P* W5 \1 l1 u  B
 E=积分(t1到t2)((P1(t)-Pa(t))^2+(P2(t)-Pa(t))^2+...+(Pn(t)-Pa(t))^2)dt
 + x  b3 y# x( R8 T最真实可靠的综合价格就是可以达到最小E的Pa(t),这里面t1代表起始时间,t2代表终止时间。如果我们比较10月和9月房价,那么t1就是9月,t2就是10月。需要注意的是,各个房子的价格函数互相是相关的,就是说correlation不为0。8 n8 t4 P1 f  }
 % S; e% n# S: \* ?
 那么,我们再来看平均房价是怎么回事。假设9月卖出房子有He,Hf,Hg这几个,10月卖出Ho,Hp,Hq这几个。
 - h- W# O& `2 m" L4 Q4 C9月的均价就是(Pe(9月)+Pf(9月)+Pg(9月))/3,10月的均价就是(Po(10月)+Pp(10月)+Pq(10月))/3。
 . M$ q" s) R9 Q. ?0 R7 M  ~. ^换言之,我们不可能有全部房子在这两个时间点的价格,因为成交的仅仅是全部房子的很小的一个子集。我们是拿一些房子的10月数据去比另一些房子9月数据。所以,我们并不知道同一个房子的价格变化,好比我们知道10月份Hq的价格,但我们没有9月份Hq的价格。一旦购房组成产生变化,10月成交的Ho,Hp,Hq可能与9月成交的He,Hf,Hg不具有很强的共性,那么这个数据就不准了。最简单的例子就是,如果Hq是个千万豪宅,那么显然会把10月的均价严重拉高。
 4 M2 z5 }5 Y% \: e% h) p' `# M0 ~6 b
 中位价比平均价好很多,假设9月卖出房子有He,Hf,Hg这几个,10月卖出Ho,Hp,Hq这几个。/ q: N8 o" v* W
 假设Pe(9月)<Pf(9月)<Pg(9月),那么10月的中位价就是Pf(9月);4 J% \0 s5 ?4 U8 N% g$ T+ v( u6 l/ o
 假设Po(10月)<Pp(10月)<Pq(10月),那么10月的中位价就是Pp(10月)。
 ( p1 x( O  g* y6 V当交易量不是太少时,可以比较精确的体现普通收入者的购房价格。不会因为Hq是千万豪宅而把数据扭曲。
 ) `' C( j$ m" U& x$ }& R# n+ V6 A* r2 P  r4 k; |2 h! t
 现在已经不难看出均价和中位价的局限,就是10月所售的房子Ho,Hp,Hq和9月售出的He,Hf,Hg并非是同样的房子,更无法代表全部从H1,H2到Hn这几十万个房子。当He,Hf,Hg与Ho,Hp,Hq具有较强共性(correlation),那么数据基本准确,但如果不是,数据就没有太大意义。所以,我们就要寻求这些房子的最大共性。这就是单位面积价格:3 a& d# E8 X& h3 F
 假设9月卖出房子有He,Hf,Hg这几个,10月卖出Ho,Hp,Hq这几个。它们的面积分别是Me,Mf,Mg,Mo,Mp,Mq。那么,+ ?' @& Z6 _4 e$ e
 9月的单位面积均价就是(Pe(9月)/Me+Pf(9月)/Mf+Pg(9月)/Mg)/3;9 }! l/ G4 s/ T& C
 10月的单位面积均价就是(Po(10月)/Mo+Pp(10月)/Mp+Pq(10月)/Mq)/3。
 5 I9 ^, x' u# {, j- G这种算法当然不是完美,但比起均价和中位价,可以更加精确体现10月所售房子,和9月所售房子,以及广大未售房子的共性。9 `. U+ ]6 y! ^3 }, V
 : F+ J: S" i: I1 P- K# b
 有爱抬杠的仁兄说单位面积均价对于地大房子小的不适合,我的回答是:这是完全正常的概率分布,我们只需知道主流的单位面积均价就可以了。从数学角度而言,我们就假设一个高斯分布,如果单位面积均价的平均值(mean)是$300/sqft,那么500尺的100万的房子是$2000/sqft,属于小概率事件,可以视为在3个standard deviation之外了。我们只需考虑正负1个standard deviation之内的是否合理就足够了。4 [( M8 s7 z! o5 S5 b
 6 m  T/ a$ b/ Z3 p' I2 w
 前面都是理论,下面说2个具体的小例子:! H5 G- p6 {6 w( E( I( o& H: {
 1)加州南部(圣迭戈,洛杉矶)是美国房子最贵的地方之一,均价60~70万。为了计算方便,假设1美元=1加元。就是说,是爱城的双倍。但事实是,爱城50万的房子,在那里要150~200万。同样的房子是3~4倍。问题出在哪里?因为均价受限于人的工资支付力的极限。当房价持续上涨时,人们开始求其次,(好比说10月所售的房子Ho,Hp,Hq比9月售出的He,Hf,Hg要小起来了)。在平均价位的房子,其质量和面积不停下滑。但如果用单位面积均价就不会有这个问题。爱城50万可以买到约2000尺的新2层屋,单价$250/sqft,同样的房子在圣迭戈核心城区要150万,单价$750/sqft这样就精确体现了两地等同房子的差距。$ ^0 y. \" Z4 ~+ H' x2 E  ]! t
 
 0 v7 H5 n% T2 o0 m- P9 B1 C2)如果你走到一个建筑商那里,询问造房价格,最常见的就是他告诉你基本价是多少一尺,升级价是多少一尺。如果你回中国买房,市场通用的准则也是每平米的单价。: P$ k1 B4 d& F6 Z( U+ x
 9 f9 u6 R' x6 w  F/ c$ q
 论述到此结束,欢迎拍砖。
 | 
 |