<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>优秀是一种习惯</title>
	<atom:link href="http://taiyun.cos.name/feed/" rel="self" type="application/rss+xml" />
	<link>http://taiyun.cos.name</link>
	<description>士为知己者死 &#38; 概率统计，数据挖掘，数学模型，可视化</description>
	<lastBuildDate>Thu, 08 Dec 2011 16:28:47 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3</generator>
		<item>
		<title>中小矩阵的可视化: corrplot 更新至 0.60</title>
		<link>http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/</link>
		<comments>http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/#comments</comments>
		<pubDate>Thu, 08 Dec 2011 16:11:19 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[可视分析]]></category>
		<category><![CDATA[生活娱乐]]></category>
		<category><![CDATA[corrplot]]></category>
		<category><![CDATA[cran]]></category>
		<category><![CDATA[Git]]></category>
		<category><![CDATA[GitHub]]></category>
		<category><![CDATA[可视化]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=868</guid>
		<description><![CDATA[最近更新了两次corrplot包，最新的0.60版本较之前的0.40进步较多。之所以取名为0.60版本，意味着此包的自评分终于上了60的及格分数，也有可能是这个包的最终版本。corrplot的应用范围很明确，就是中小矩阵 (&#60;100*100) 的可视化，尤其是中小相关矩阵、距离矩阵、相似度矩阵等。 本次主要变动如下： 彻底解决了空白边距过大问题(尤其在文本标签较长时候)，这个是个历史遗留问题，之前的方法比较原始简陋，已经有好多人发邮件投诉了(要不我也没动力更改)；现在迭代来计算strwidth直至收敛，可以精确计算文本的长宽度了。控制文本大小的参数 tl.cex 也更精准了。 修订了参数名称和帮助文档，之前的参数取名、帮助文档太随意了。比如”PCA”排序就会让人错觉以为是第一主成分，目前更改成了更为妥当的”AOE”，是angular order of the eigenvectors的意思，具体参见文档。而第一主成分用”FPC”来表示了；此外，从效果来看，”AOE”排序结果一般都比”FPC”要好。提到矩阵排序，seriation包已经很NB了，更多方法可以参见此包。PS： 作者之一Kurt Hornik是R Core之一，是CRAN的主要维护人，每天都要check、答复新进来的包，德艺双馨、产出惊人，是绝对的教授中的战斗兽。 增加了zoom参数，来放缩原矩阵，使之可以轻松地应用到非[-1,1] 的矩阵；同时增加了参数cl.lim，使得颜色轴标签上只显示需要展示的部分。当然，此时颜色轴上的标签也会和缩放前的一样。 增加了横轴文本标签的旋转角度参数tl.srt，这个我虽不喜欢，但有人希望加这个方便阅读。总结来看，corrplot的每次更新都是有人发邮件说需要这样那样的功能…… 增加、删除了一些函数。主要是加了corrMatOrder() 和corrplot.mixed () 函数来做矩阵排序和混合可视工作。删除了corrplot.*()系列不那么常用的函数。 进一步优化了代码并谨慎地选择了各个参数的默认值。虽然这个没有什么技术难度，但因为涉及到的很多都是绘图，审美之类的对我这种时常喜欢纠结的土人实在很麻烦…… 其实，更新最多的时间竟然花在了默认参数的选择之上，这个可能和我的星座有关！！ 可视化是数据&#38;模型&#38;结果的美学展示，其中在图形展示这一块主观性较强，因此corrplot很注重各个细节，提供了很多选项让大家自己选择。但就因为这这样，corrplot函数的参数多达43+个，显得很累赘。这就是所谓的双刃剑吧。 此外，为了体验GitHub，我把corrplot主页从Rforge上迁移到了GitHub： https://github.com/taiyun/corrplot 如果有什么问题或者新的需求请到Issues那里提出。 再此外，我把R与最优化的文档也放在GitHub上了: https://github.com/taiyun/Optimization-using-R ,我自己近来空闲时间很少了，希望感兴趣的同学能对这份文档增删添补，以方便大家快速、便捷地查阅、使用。 为了使得本博文不那么呆板，文末以图会友吧： 相关文章2011/10/22 -- 秋雨梧桐叶落时: corrplot包0.40版本出炉 (12)2010/05/29 -- 相关矩阵中置信区间之涂鸦 (10)2010/04/18 -- corrplot 0.2-0版本出炉 (20)2009/08/30 -- corrplot即将提交到CRAN (0)2009/08/23 -- 距离矩阵可视化&#038;用TSP方法重排变量 (0)2009/04/21 -- 相关阵的方块图 (0)2011/05/03 -- 第四届R会议, R与最优化 (7)2011/04/20 -- EBImage包以及学术模特Lena的八卦 <a href='http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>最近更新了两次corrplot包，最新的<a href=" http://cran.r-project.org/web/packages/corrplot/" target="_blank">0.60版本</a>较之前的0.40进步较多。之所以取名为0.60版本，意味着此包的自评分终于上了60的及格分数，也有可能是这个包的最终版本。corrplot的应用范围很明确，就是中小矩阵 (&lt;100*100) 的可视化，尤其是中小相关矩阵、距离矩阵、相似度矩阵等。</p>
<p>本次主要变动如下：</p>
<ol>
<li>彻底解决了空白边距过大问题(尤其在文本标签较长时候)，这个是个历史遗留问题，之前的方法比较原始简陋，已经有好多人发邮件投诉了(要不我也没动力更改)；现在迭代来计算strwidth直至收敛，可以精确计算文本的长宽度了。控制文本大小的参数 tl.cex 也更精准了。</li>
<li>修订了参数名称和帮助文档，之前的参数取名、帮助文档太随意了。比如”PCA”排序就会让人错觉以为是第一主成分，目前更改成了更为妥当的”AOE”，是angular order of the eigenvectors的意思，具体参见文档。而第一主成分用”FPC”来表示了；此外，从效果来看，”AOE”排序结果一般都比”FPC”要好。提到矩阵排序，seriation包已经很NB了，更多方法可以参见此包。PS： 作者之一<a href="http://www.ci.tuwien.ac.at/~hornik/" target="_blank">Kurt Hornik</a>是R Core之一，是CRAN的主要维护人，每天都要check、答复新进来的包，德艺双馨、产出惊人，是绝对的教授中的战斗兽。</li>
<li>增加了zoom参数，来放缩原矩阵，使之可以轻松地应用到非[-1,1] 的矩阵；同时增加了参数cl.lim，使得颜色轴标签上只显示需要展示的部分。当然，此时颜色轴上的标签也会和缩放前的一样。</li>
<li>增加了横轴文本标签的旋转角度参数tl.srt，这个我虽不喜欢，但有人希望加这个方便阅读。总结来看，corrplot的每次更新都是有人发邮件说需要这样那样的功能……</li>
<li>增加、删除了一些函数。主要是加了corrMatOrder() 和corrplot.mixed () 函数来做矩阵排序和混合可视工作。删除了corrplot.*()系列不那么常用的函数。</li>
<li>进一步优化了代码并谨慎地选择了各个参数的默认值。虽然这个没有什么技术难度，但因为涉及到的很多都是绘图，审美之类的对我这种时常喜欢纠结的土人实在很麻烦…… 其实，更新最多的时间竟然花在了默认参数的选择之上，这个可能和我的星座有关！！</li>
</ol>
<p>可视化是数据&amp;模型&amp;结果的美学展示，其中在图形展示这一块主观性较强，因此corrplot很注重各个细节，提供了很多选项让大家自己选择。但就因为这这样，corrplot函数的参数多达43+个，显得很累赘。这就是所谓的双刃剑吧。</p>
<p>此外，为了体验GitHub，我把corrplot主页从Rforge上迁移到了GitHub：<a href="https://github.com/taiyun/corrplot" target="_blank"> https://github.com/taiyun/corrplot</a> 如果有什么问题或者新的需求请到<a href="https://github.com/taiyun/corrplot/issues" target="_blank">Issues</a>那里提出。</p>
<p>再此外，我把R与最优化的文档也放在GitHub上了: <a href="https://github.com/taiyun/Optimization-using-R" target="_blank">https://github.com/taiyun/Optimization-using-R</a> ,我自己近来空闲时间很少了，希望感兴趣的同学能对这份文档增删添补，以方便大家快速、便捷地查阅、使用。</p>
<p>为了使得本博文不那么呆板，文末以图会友吧：</p>
<p style="text-align: center;"><a href="http://taiyun.cos.name/wp-content/uploads/2011/12/corr.png"><img class="aligncenter size-full wp-image-870" title="mtcars数据的相关矩阵可视化图形" src="http://taiyun.cos.name/wp-content/uploads/2011/12/corr.png" alt="" width="777" height="709" /></a></p>
<h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2011/10/22 -- <a href="http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/" title="秋雨梧桐叶落时: corrplot包0.40版本出炉">秋雨梧桐叶落时: corrplot包0.40版本出炉</a> (12)</li><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2010/04/18 -- <a href="http://taiyun.cos.name/2010/04/corrplot-0-20-came-out/" title="corrplot 0.2-0版本出炉">corrplot 0.2-0版本出炉</a> (20)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li><li>2009/08/23 -- <a href="http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/" title="距离矩阵可视化&#038;用TSP方法重排变量">距离矩阵可视化&#038;用TSP方法重排变量</a> (0)</li><li>2009/04/21 -- <a href="http://taiyun.cos.name/2009/04/squares-chart-of-correlation-matrix/" title="相关阵的方块图">相关阵的方块图</a> (0)</li><li>2011/05/03 -- <a href="http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/" title="第四届R会议, R与最优化">第四届R会议, R与最优化</a> (7)</li><li>2011/04/20 -- <a href="http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/" title="EBImage包以及学术模特Lena的八卦">EBImage包以及学术模特Lena的八卦</a> (4)</li><li>2011/04/13 -- <a href="http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/" title="周总理与小波分析 (小波分析连载系列之零)">周总理与小波分析 (小波分析连载系列之零)</a> (12)</li><li>2010/05/10 -- <a href="http://taiyun.cos.name/2010/05/co-author-network-in-chinese-three-top-journal/" title="国内三大经济期刊合作作者关系网络及其可视化">国内三大经济期刊合作作者关系网络及其可视化</a> (19)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>秋雨梧桐叶落时: corrplot包0.40版本出炉</title>
		<link>http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/</link>
		<comments>http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/#comments</comments>
		<pubDate>Sat, 22 Oct 2011 11:22:44 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[可视分析]]></category>
		<category><![CDATA[corrplot]]></category>
		<category><![CDATA[cran]]></category>
		<category><![CDATA[白居易]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=837</guid>
		<description><![CDATA[前几天更新了下corrplot，修正了一个配色上的bug(感谢陈钢师兄)，并且加了我个人不太喜欢的混合形式的矩阵可视化方法(就是上下三角分别用两种形式画图，虽然花哨，但我觉得不伦不类的)；萝卜青菜，各有所爱，经常有人发邮件建议加入这个功能，故修改了下函数来满足各路神仙的需求。corrplot当前的示例图片见此(共58张图片)。 新添加的混合方法的示例代码和图片如下，一个方圆、一个扁圆(个人觉得像是用来把玩的工艺品，而不是统计图形了)： library("corrplot") corr &#60;- cor(mtcars) ## 天圆地方 corrplot(corr,order="PCA",type="upper",addtextlabel="no") corrplot(corr,add=TRUE, type="lower", method="square",order="PCA",addtextlabel="d") ## 天圆地扁 corrplot(corr,order="PCA",type="upper",addtextlabel="no") corrplot(corr,add=TRUE, type="lower", method="ell",order="PCA",addtextlabel="d") 不知道下一次更新又是什么时候，不过我希望最终版本号能比较靠近1.00~ ############ 跑题 ########### 《长恨歌》曰：春风桃李花开日，秋雨梧桐叶落时。我觉得这两句极尽春秋之神韵，寥寥十四字意境全出，且留给读者无尽的遐想。今儿天气有变，让我稍稍嗅到了秋天的味道，虽未落雨，但还是在标题中加上一句“秋雨梧桐叶落时”，让corrplot乘机也附庸下风雅。 此外，天气转凉，暖气也快来了，但我还是干板+凉席，并且觉得很是惬意，不知在北京我会不会一年四季都这么继续下去。 相关文章2011/12/09 -- 中小矩阵的可视化: corrplot 更新至 0.60 (5)2010/05/29 -- 相关矩阵中置信区间之涂鸦 (10)2010/04/18 -- corrplot 0.2-0版本出炉 (20)2011/05/03 -- 第四届R会议, R与最优化 (7)2011/04/20 -- EBImage包以及学术模特Lena的八卦 (4)2011/04/13 -- 周总理与小波分析 (小波分析连载系列之零) (12)2009/12/17 -- 用R来玩分形 (11)2009/12/14 -- 第二届R会议那些事儿(上海) (25)2009/12/08 <a href='http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>前几天更新了下<a href="http://cran.r-project.org/web/packages/corrplot/index.html" target="_blank">corrplot</a>，修正了一个配色上的bug(感谢陈钢师兄)，并且加了我个人不太喜欢的混合形式的矩阵可视化方法(就是上下三角分别用两种形式画图，虽然花哨，但我觉得不伦不类的)；萝卜青菜，各有所爱，经常有人发邮件建议加入这个功能，故修改了下函数来满足各路神仙的需求。<a title="示例图片" href="https://skydrive.live.com/?cid=13EE29E4AC480566&amp;id=13EE29E4AC480566%21106" target="_blank">corrplot当前的示例图片见此</a>(共58张图片)。</p>
<p>新添加的混合方法的示例代码和图片如下，一个方圆、一个扁圆(个人觉得像是用来把玩的工艺品，而不是统计图形了)：</p>
<pre class="sh_slang">library("corrplot")
corr &lt;- cor(mtcars)
## 天圆地方
corrplot(corr,order="PCA",type="upper",addtextlabel="no")
corrplot(corr,add=TRUE, type="lower", method="square",order="PCA",addtextlabel="d")
## 天圆地扁
corrplot(corr,order="PCA",type="upper",addtextlabel="no")
corrplot(corr,add=TRUE, type="lower", method="ell",order="PCA",addtextlabel="d")</pre>
<div id="attachment_843" class="wp-caption aligncenter" style="width: 672px"><a href="http://taiyun.cos.name/wp-content/uploads/2011/10/pic1.png"><img class="size-full wp-image-843 " src="http://taiyun.cos.name/wp-content/uploads/2011/10/pic1.png" alt="" width="662" height="605" /></a><p class="wp-caption-text">天圆地方</p></div>
<div id="attachment_843" class="wp-caption aligncenter" style="width: 672px"><a href="http://taiyun.cos.name/wp-content/uploads/2011/10/pic2.png"><img class="size-full wp-image-843 " src="http://taiyun.cos.name/wp-content/uploads/2011/10/pic2.png" alt="" width="662" height="605" /></a><p class="wp-caption-text">天圆地扁</p></div>
<p>不知道下一次更新又是什么时候，不过我希望最终版本号能比较靠近1.00~</p>
<p><span style="color: #008000;"><strong>############ 跑题 ###########<br />
</strong></span></p>
<p>《长恨歌》曰：春风桃李花开日，秋雨梧桐叶落时。我觉得这两句极尽春秋之神韵，寥寥十四字意境全出，且留给读者无尽的遐想。今儿天气有变，让我稍稍嗅到了秋天的味道，虽未落雨，但还是在标题中加上一句“秋雨梧桐叶落时”，让corrplot乘机也附庸下风雅。</p>
<p>此外，天气转凉，暖气也快来了，但我还是干板+凉席，并且觉得很是惬意，不知在北京我会不会一年四季都这么继续下去。</p>
<p><a href="http://taiyun.cos.name/wp-content/uploads/2011/10/IMG_5209.jpg"><img class="aligncenter size-large wp-image-849" title="bed" src="http://taiyun.cos.name/wp-content/uploads/2011/10/IMG_5209-1024x768.jpg" alt="" width="695" height="521" /></a></p>
<script type="text/javascript" src="/wp-content/plugins/shjs-syntax-hiliter/shjs/lang/sh_slang.js"></script><h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2011/12/09 -- <a href="http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/" title="中小矩阵的可视化: corrplot 更新至 0.60">中小矩阵的可视化: corrplot 更新至 0.60</a> (5)</li><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2010/04/18 -- <a href="http://taiyun.cos.name/2010/04/corrplot-0-20-came-out/" title="corrplot 0.2-0版本出炉">corrplot 0.2-0版本出炉</a> (20)</li><li>2011/05/03 -- <a href="http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/" title="第四届R会议, R与最优化">第四届R会议, R与最优化</a> (7)</li><li>2011/04/20 -- <a href="http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/" title="EBImage包以及学术模特Lena的八卦">EBImage包以及学术模特Lena的八卦</a> (4)</li><li>2011/04/13 -- <a href="http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/" title="周总理与小波分析 (小波分析连载系列之零)">周总理与小波分析 (小波分析连载系列之零)</a> (12)</li><li>2009/12/17 -- <a href="http://taiyun.cos.name/2009/12/using-r-to-play-fractal-geometry/" title="用R来玩分形">用R来玩分形</a> (11)</li><li>2009/12/14 -- <a href="http://taiyun.cos.name/2009/12/all-about-the-2nd-r-conference/" title="第二届R会议那些事儿(上海)">第二届R会议那些事儿(上海)</a> (25)</li><li>2009/12/08 -- <a href="http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/" title="第二届R会议随想">第二届R会议随想</a> (47)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/feed/</wfw:commentRss>
		<slash:comments>12</slash:comments>
		</item>
		<item>
		<title>玉簪暗暗惜华年：刘嘉忆和Seetapun猜想</title>
		<link>http://taiyun.cos.name/2011/10/jiayi-liu-and-seetapum/</link>
		<comments>http://taiyun.cos.name/2011/10/jiayi-liu-and-seetapum/#comments</comments>
		<pubDate>Sat, 08 Oct 2011 14:59:01 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[生活娱乐]]></category>
		<category><![CDATA[Seetapun猜想]]></category>
		<category><![CDATA[侯振挺]]></category>
		<category><![CDATA[倩女幽魂]]></category>
		<category><![CDATA[刘嘉忆]]></category>
		<category><![CDATA[数理逻辑]]></category>
		<category><![CDATA[高涛]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=823</guid>
		<description><![CDATA[十里平湖绿满天，玉簪暗暗惜华年。若得雨盖能相护，只羡鸳鸯不羡仙。 87版的电影《倩女幽魂》非常经典，里面的“十里平湖霜满天，寸寸青丝愁华年。对月形单望相护，只羡鸳鸯不羡仙。”让我着实陶醉，我曾经在七夕的时候给朋友们发过这段视频；不知道大家有没有被我雷到。 昨天听同学说《倩女幽魂》还有个60版的也很不错，古色古香的；我很好奇得看了下，才发现87版的诗是从60版的“十里平湖绿满天，玉簪暗暗惜华年。若得雨盖能相护，只羡鸳鸯不羡仙。”中修改而来的。玉簪暗暗惜华年，里面的“玉簪”指的是白莲花，小诗表的是宁采臣和聂小倩相互爱慕之情。本来想发一番感慨，但上了豆瓣看了些评论之后，我顿时觉得不用多此一举了。 不过“玉簪暗暗惜华年”一句，让我很离奇也很自然地联想到了自学成才解决数理逻辑中Seetapun猜想的刘嘉忆学弟(原名刘路)。对于Seetapun猜想，我完全不了解，只是听说这是数理逻辑中比较有名的一个猜想。但我很早就知道他成天泡在图书馆，啃一些“硬骨头”：如莲之出淤泥而不染、濯清涟而不妖，能在浮华、堕落的大环境中整天泡在图书馆里，安静地、坚持不懈地做自己喜欢的事情。我没有想过能证明什么重要猜想，但我这份平淡的心态和坚持不懈却是我很最需要学习的。 此外，最近网络对此事的报道实在太多太杂，评论也很杂乱，比如在腾讯、新浪、科学网、新浪、腾讯微博等，其中有些评论还恶语中伤侯振挺老师；侯振挺老师很低调平和和蔼，是我本科阶段最敬重的老师，他在本科期间也自学解决了排队论中的三大难题之一“巴尔姆断言问题”，这一点倒和刘嘉忆学弟很像的。侯老师一向极为爱才惜才，对于刘嘉忆，也是如此；虽然专业不同，但侯老师还是很积极地努力为其争取资源并创造方便（比如让其提前毕业等），但一些媒体的新闻稿写得断章取义，很多不明真相的网民又开始骂人~ 这次回沙一聚，得知刘嘉忆正在申请伯克利，他告诉我们他的GRE没有过申请学校的线，但既然他的文章能得到伯克利教授的赏识，我想对他来说GRE这个东西已经是可有可无的了。 刚刚得知刘嘉忆最近深受各路媒体烦扰，连朋友高涛学弟也被新华社骚扰。希望此事能迅速平静下来，长路漫漫，祝愿刘嘉忆能在学术的天空中飞得更高更远。 相关文章2011/07/04 -- 严老师生日快乐，淡定，给力以及治学 (2)]]></description>
			<content:encoded><![CDATA[<blockquote><p>十里平湖绿满天，玉簪暗暗惜华年。若得雨盖能相护，只羡鸳鸯不羡仙。</p></blockquote>
<p>87版的电影《倩女幽魂》非常经典，里面的“<a title="视频中的音乐是倩女幽魂第二部的" href="http://v.youku.com/v_show/id_XMjk5NzYzMTgw.html" target="_blank">十里平湖霜满天，寸寸青丝愁华年。对月形单望相护，只羡鸳鸯不羡仙。</a>”让我着实陶醉，我曾经在七夕的时候给朋友们发过这段视频；不知道大家有没有被我雷到。</p>
<p>昨天听同学说《倩女幽魂》还有个60版的也很不错，古色古香的；我很好奇得看了下，才发现87版的诗是从60版的“十里平湖绿满天，玉簪暗暗惜华年。若得雨盖能相护，只羡鸳鸯不羡仙。”中修改而来的。玉簪暗暗惜华年，里面的“玉簪”指的是白莲花，小诗表的是宁采臣和聂小倩相互爱慕之情。本来想发一番感慨，但上了豆瓣<a title="比如这篇" href="http://movie.douban.com/review/4958393/" target="_blank">看了些评论</a>之后，我顿时觉得不用多此一举了。</p>
<p style="text-align: center;"><img class="aligncenter" src="http://image.intwap.com/desk/480x272/2009/b8f975a1ca381828b4163fd94499f18c.jpg" alt="玉簪暗暗惜华年" width="480" height="272" /></p>
<p>不过“玉簪暗暗惜华年”一句，让我很离奇也很自然地联想到了自学成才<a href="http://news.its.csu.edu.cn/Archive/201109/20110926111928998.shtml" target="_blank">解决数理逻辑中Seetapun猜想的刘嘉忆学弟</a>(原名刘路)。对于Seetapun猜想，我完全不了解，只是听说这是数理逻辑中比较有名的一个猜想。但我很早就知道他成天泡在图书馆，啃一些“硬骨头”：如莲之出淤泥而不染、濯清涟而不妖，能在浮华、堕落的大环境中整天泡在图书馆里，安静地、坚持不懈地做自己喜欢的事情。我没有想过能证明什么重要猜想，但我这份平淡的心态和坚持不懈却是我很最需要学习的。</p>
<p>此外，最近网络对此事的报道实在太多太杂，评论也很杂乱，比如在<a href="http://news.qq.com/a/20111008/000785.htm" target="_blank">腾讯</a>、<a href="http://news.sina.com.cn/s/2011-10-08/022623265797.shtml" target="_blank">新浪</a>、<a href="http://news.sciencenet.cn/htmlnews/2011/10/253475.shtm" target="_blank">科学网</a>、新浪、腾讯微博等，其中有些评论还恶语中伤侯振挺老师；<a href="http://baike.baidu.com/view/88449.htm" target="_blank">侯振挺老师</a>很低调平和和蔼，是我本科阶段最敬重的老师，他在本科期间也自学解决了排队论中的三大难题之一“巴尔姆断言问题”，这一点倒和刘嘉忆学弟很像的。侯老师一向极为爱才惜才，对于刘嘉忆，也是如此；虽然专业不同，但侯老师还是很积极地努力为其争取资源并创造方便（比如让其提前毕业等），但一些媒体的新闻稿写得断章取义，很多不明真相的网民又开始骂人~</p>
<p>这次回沙一聚，得知刘嘉忆正在申请伯克利，他告诉我们他的GRE没有过申请学校的线，但既然他的文章能得到伯克利教授的赏识，我想对他来说GRE这个东西已经是可有可无的了。</p>
<p>刚刚得知刘嘉忆最近深受各路媒体烦扰，连朋友<a href="http://www.gaotao.name/" target="_blank">高涛</a>学弟也被新华社骚扰。希望此事能迅速平静下来，长路漫漫，祝愿刘嘉忆能在学术的天空中飞得更高更远。</p>
<h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2011/07/04 -- <a href="http://taiyun.cos.name/2011/07/happy-birthday-professor-yan/" title="严老师生日快乐，淡定，给力以及治学">严老师生日快乐，淡定，给力以及治学</a> (2)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2011/10/jiayi-liu-and-seetapum/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>严老师生日快乐，淡定，给力以及治学</title>
		<link>http://taiyun.cos.name/2011/07/happy-birthday-professor-yan/</link>
		<comments>http://taiyun.cos.name/2011/07/happy-birthday-professor-yan/#comments</comments>
		<pubDate>Mon, 04 Jul 2011 14:38:53 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[概率统计]]></category>
		<category><![CDATA[WEB马氏骨架过程]]></category>
		<category><![CDATA[严加安]]></category>
		<category><![CDATA[侯振挺]]></category>
		<category><![CDATA[生日快乐]]></category>
		<category><![CDATA[陈木法]]></category>
		<category><![CDATA[随机分析]]></category>
		<category><![CDATA[马志明]]></category>
		<category><![CDATA[马氏骨架过程]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=806</guid>
		<description><![CDATA[今天和CK蹭去中科院为严加安老师庆祝七十大寿，祝寿会议的主题是《随机分析及其在金融数学中的应用》。国内概率届的知名人士几乎都来全了(除了年岁太高来不了的)，也包括一些从海外赶来的，热闹得紧。不过这次的报告都比较随意，报告人时不时谈了好多和严老师的八卦点滴。其中比较给力的八卦是严老师的书法、摄影颇有造诣，爱好诗歌并且非常潮！！下面摘录两首会议手册中严老师赞颂“淡定”和“给力”的16行诗，以作众乐: 论淡定的一首： 《淡定》 淡定是一种风度， 潇洒从容自如。 淡定是一种自信， 坚定沉着果断。 淡定是一种儒雅， 豁达宽宏大度。 淡定是一种智慧， 处事难得糊塗。 淡定是一种素质， 淡雅纯洁开朗。 淡定是一种品格， 诚信一如既往。 淡定是一种修养， 荣辱得失淡忘。 淡定是一种境界， 春风秋水阳光。 赞给力的一首： 《赞“给力”》 “给力”，一个多么神奇的词汇， 曾是“带劲”一词的闽南方言。 “给力”，凭借网络传播的快捷， 霎时间有了新的含义和韵味。 “给力”，赞美如此传神， 比“牛”和“酷”更振聋发聩。 “给力”，它吸引眼球、令人心醉， 难怪它在华人世界变得风靡。 “给力”或“不给力”，明快简洁， 对事物赞赏或鄙视做出果断判决。 “不给力”比“不带劲”更贴切， 斥责中包含委婉的遗憾和惋惜。 网络神奇，是文化传播的双刃剑， 既能推陈出新，又产出文化垃圾。 传承和繁荣中华文化，责任在肩， 弘扬真、善、美，抵制低俗诡谲。 更多参见这里。 此外，今天还见到了侯振挺老师，很是亲切:) 至于今天的报告，我比较感兴趣的是马志明老师的Web Markov Skeleton Process (WMSP), 这里是一份关于WMSP的幻灯片。WMSP和侯老师提出的Markov Skeleton Process (MSP，参见这里的幻灯片及其参考文献)有所不同。侯老师的MSP是很宽泛的一类过程，而马老师的WMSP是和微软研究所合作的，直接面对WEB行为，更针对某一类具体问题，研究地更细更窄。 最后分享严老师于2006年10月在中国科大MPA探讨如何做科研的一些心得，说的非常好。下面是他的演讲内容： 一、打好基础、练好基本功 学习任何一门数学分支，首先要打好基础、练好基本功。所谓基本功，就是对基本概念和主要定理的理解和灵活应用，以及对主要定理证明技巧的掌握。我常用“工欲善其事，先必利其器”这一格言劝导学生打好基础。 二、博观而约取，厚积而薄发 华罗庚有一精辟的论点：获得书本知识是“从薄到厚”再“从厚到薄”的过程。宋朝大文学家苏轼有一名句言：“博观而约取，厚积而薄发”。前者是指“在博览群书时要汲取书中的要领和精髓”，这里“薄发”的原意是“不要随便发表意见”，后人把它引伸为“从大量的知识或材料积累中提炼出精华部分再著书立说”。我的座右铭是：不求著作等身，但企文章久远。 三、直觉、想象和灵感是科技创新的催化剂 对从事科学研究的人来说，最基本的素质应该是创新能力。唐代大文学家韩愈说过：“业精于勤，荒于嬉，毁于随。”这里所说的“随”就是指毫无创见。如何才能创新呢？爱因斯坦有一句名言：“想象力比知识更重要”。他在纪念普朗克60岁生日的演讲中又说：“物理学家的最高使命是得到那些普遍的基本定律，由此世界体系就能用单纯的演绎法建立起来。要通向这些定律，没有逻辑推理的途径，只有通 <a href='http://taiyun.cos.name/2011/07/happy-birthday-professor-yan/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>今天和CK蹭去中科院为严加安老师庆祝七十大寿，祝寿会议的主题是《<a href="http://www.amt.ac.cn/2011yja/index.html" target="_blank">随机分析及其在金融数学中的应用</a>》。国内概率届的知名人士几乎都来全了(除了年岁太高来不了的)，也包括一些从海外赶来的，热闹得紧。不过这次的报告都比较随意，报告人时不时谈了好多和严老师的八卦点滴。其中比较给力的八卦是严老师的书法、摄影颇有造诣，爱好诗歌并且非常潮！！下面摘录两首会议手册中严老师赞颂“淡定”和“给力”的16行诗，以作众乐:</p>
<p>论淡定的一首：</p>
<blockquote><p><strong> 《淡定》</strong><br />
淡定是一种风度，<br />
潇洒从容自如。<br />
淡定是一种自信，<br />
坚定沉着果断。<br />
淡定是一种儒雅，<br />
豁达宽宏大度。<br />
淡定是一种智慧，<br />
处事难得糊塗。<br />
淡定是一种素质，<br />
淡雅纯洁开朗。<br />
淡定是一种品格，<br />
诚信一如既往。<br />
淡定是一种修养，<br />
荣辱得失淡忘。<br />
淡定是一种境界，<br />
春风秋水阳光。</p></blockquote>
<p>赞给力的一首：</p>
<blockquote><p><strong>《赞“给力”》</strong><br />
“给力”，一个多么神奇的词汇，<br />
曾是“带劲”一词的闽南方言。<br />
“给力”，凭借网络传播的快捷，<br />
霎时间有了新的含义和韵味。<br />
“给力”，赞美如此传神，<br />
比“牛”和“酷”更振聋发聩。<br />
“给力”，它吸引眼球、令人心醉，<br />
难怪它在华人世界变得风靡。<br />
“给力”或“不给力”，明快简洁，<br />
对事物赞赏或鄙视做出果断判决。<br />
“不给力”比“不带劲”更贴切，<br />
斥责中包含委婉的遗憾和惋惜。<br />
网络神奇，是文化传播的双刃剑，<br />
既能推陈出新，又产出文化垃圾。<br />
传承和繁荣中华文化，责任在肩，<br />
弘扬真、善、美，抵制低俗诡谲。</p></blockquote>
<p>更多参见<a href="http://sxx.hynu.cn/ReadNews.asp?NewsID=1678" target="_blank">这里</a>。</p>
<p>此外，今天还见到了侯振挺老师，很是亲切:)</p>
<p>至于今天的报告，我比较感兴趣的是马志明老师的Web Markov Skeleton Process (WMSP), <a href="http://math.bnu.edu.cn/probab/Workshop2011/Talks/MaZM.ppt" target="_blank">这里</a>是一份关于WMSP的幻灯片。WMSP和侯老师提出的Markov Skeleton Process (MSP，参见<a href="http://math.bnu.edu.cn/probab/Workshop2004/talks/houzt.pdf" target="_blank">这里的幻灯片</a>及其参考文献)有所不同。侯老师的MSP是很宽泛的一类过程，而马老师的WMSP是和微软研究所合作的，直接面对WEB行为，更针对某一类具体问题，研究地更细更窄。</p>
<p>最后分享严老师于2006年10月在中国科大MPA探讨如何做科研的一些心得，说的非常好。下面是他的演讲内容：</p>
<h2>一、打好基础、练好基本功</h2>
<p>学习任何一门数学分支，首先要打好基础、练好基本功。所谓基本功，就是对<span style="color: #000000;">基本概念和主要定理的理解和灵活应用，以及对主要定理证明技巧的掌握。我常用“工欲善其事，先必利其器”这一格言劝导学生打好基础。</span></p>
<h2>二、博观而约取，厚积而薄发</h2>
<p>华罗庚有一精辟的论点：获得书本知识是“从薄到厚”再“从厚到薄”的过程。宋朝大文学家苏轼有一名句言：“博观而约取，厚积而薄发”。前者是指“在博览群书时要汲取书中的要领和精髓”，这里“薄发”的原意是“不要随便发表意见”，后人把它引伸为“从大量的知识或材料积累中提炼出精华部分再著书立说”。我的座右铭是：<span style="color: #000000;">不求著作等身，但企文章久远。</span></p>
<h2>三、直觉、想象和灵感是科技创新的催化剂</h2>
<p>对从事科学研究的人来说，最基本的素质应该是创新能力。唐代大文学家韩愈说过：“业精于勤，荒于嬉，毁于随。”这里所说的“随”就是指毫无创见。如何才能创新呢？爱因斯坦有一句名言：“想象力比知识更重要”。他在纪念普朗克60岁生日的演讲中又说：“物理学家的最高使命是得到那些普遍的基本定律，由此世界体系就能用单纯的演绎法建立起来。要通向这些定律，没有逻辑推理的途径，只有通 严加安  严加安过建立在经验的同感的理解之上的那种直觉”。数学家庞加莱也有一句名言：“我们靠逻辑来证明，但要靠直觉来发明”。这些名言告诉我们：创新的基础在于长期的知识积累，但更需要有丰富的想象力和敏锐的直觉。关于创新我有一个比喻：科技创新犹如化学反应，知识是载体，直觉、想象和灵感是催化剂。</p>
<p>长期的知识积累、丰富的想象力和敏锐的直觉是创新工作最重要的准备。除此以外，还要有其它的准备。首先，对研究的问题要有浓厚的兴趣，要全身心的投入，并对解决问题有强烈的愿望；其次，对别人在相关问题上获得的新结果要尽量去了解，要善于将不同结果进行对比；第三，要重视与同行讨论和交流。</p>
<h2>四、创造产生机遇的环境</h2>
<p>做出创新成果也需要有一定的机遇，但机遇只施惠于有准备的头脑（巴斯德语）。“机遇是可遇不可求”的说法是可以商榷的。我认为在一定条件下可以人为地去创造产生机遇的环境。我的做法是：为了保持研究活力和对研究问题有新鲜感，我每隔一段时期就改变自己的研究领域，因为在新领域里机遇会多一些。在改变研究领域的过渡期内，我往往也同时研究几个相关领域。我从1973年到1984年主要从事鞅论和随机过程一般理论的研究；从1985年到1995年主要从事白噪声分析研究，同时也研究鞅论和随机分析；从1995年到现在主要从事金融数学研究。上世纪80年代初，正是白噪声分析理论初创时期，我于1985年在斯特拉斯堡大学高等数学研究所访问时，Meyer教授建议我关注这一新领域。由于我有较好的泛函分析基础，我抓住了这一机遇，很快进入了白噪声分析领域，并做出了一些基础性贡献。我和Meyer教授合作提出的白噪声分析数学框架被文献称为“Meyer-Yan空间”，并被国际上权威的《数学百科全书》引述。</p>
<h2>五、提高文化素质</h2>
<p>做学问除了要提高自己的专业素质外，还要加强文学和艺术的修养来提高自己的文化素质。最近读了《中国研究生》第5期上登载的一篇记者采访华中科技大学前校长杨叔子院士的访谈录，很有同感。杨院士在对比人文思维和科学思维时说道：“人文思维是原创思维的主要源泉。人文思维是开放的形象思维，是直觉，是顿悟，是灵感，……，科学思维是逻辑思维，然而科学领域的原创性成就主要不源于逻辑思维，人文思维带来的令人惊叹的灵感与‘猜想’，才能实现原创性。”他援引了爱因斯坦的如下名言：“物理给我知识，艺术给我想象力，知识是有限的，而艺术所开拓的想象力是无限的。”我猜测爱因斯坦所说的“艺术”是泛指“人文文化”。“科学文化”与“人文文化”的关系就是科学与艺术的关系。科学家的理论和艺术家的作品一样，都不可能是对客观事物绝对的和纯粹的反映或描述，而是对客观事物的某些特征的一种“模式化”的构思和思维的创造。</p>
<h2>六、数学的美学标准</h2>
<p>“真”与“美”是评价科学与艺术的共同准则。对数学研究而言，“真”的准则是不言而喻的，而且是容易达到的，因为任何一个在逻辑推理上正确无误的数学命题都是“真”的。对一项数学成果的评价，一是看它的学术价值，二是看它的美。数学家哈代关于数学的美有如下精辟的论述：“数学家的模式正像画家或诗人的模式一样，必须是充满美感的；数学的概念就像画家的颜色或诗人的文字一样，也必须和谐一致。美感是首要的试金石，丑陋的数学在世上是站不住脚的。”他又说：“数学定理的美在很大程度上依赖其严肃性，……。一个‘严肃’的定理是一个包含‘有意义的’概念的定理。”我认为一个对数学缺乏美感的人是很难做出美的数学来的。如何培养自己的数学的审美观和鉴赏力？阅读数学大师们的论著是一个有效途径。</p>
<h2>七、做学问的思想境界</h2>
<p>下面谈谈做学问的思想境界问题。王国维在《人间词话》的开题中说：“词以境界为最上。有境界则自成高格，自有名句”。他写道：“古今之成大事业、大学问者，必经过三种之境 严加安获奖书法界：‘昨夜西风凋碧树。独上高楼，望尽天涯路。’此第一境界也。‘衣带渐宽终不悔，为伊消得人憔悴。’此第二境界也。 ‘众里寻她千百度，蓦然回首，那人正在，灯火阑珊处。’此第三境界也。”这里王国维借用晏殊的词句来比喻开始做学问时的踌躇满志的心态；他借用柳永表现爱情的词句来比喻做学问要有“锲而不舍、甘愿奉献”的精神；他借用辛弃疾赞美一超俗女子的词句来比喻做学问要“淡泊名利、自甘寂寞、不随波逐流”。 当前在学术界有一种急功近利的“三F现象”：浮躁，肤浅，浮夸。</p>
<p>最后，我想用俄国文学家赫尔岑的如下一段话来结束我的讲演：“在科学上，除了汗流满面是没有其它获致办法的；热情也罢，幻想也罢，以整个身心渴望也罢，都不能代替劳动。”</p>
<h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2011/10/08 -- <a href="http://taiyun.cos.name/2011/10/jiayi-liu-and-seetapum/" title="玉簪暗暗惜华年：刘嘉忆和Seetapun猜想">玉簪暗暗惜华年：刘嘉忆和Seetapun猜想</a> (6)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2011/07/happy-birthday-professor-yan/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Google的语音识别搜索真好玩</title>
		<link>http://taiyun.cos.name/2011/06/google-voice-search/</link>
		<comments>http://taiyun.cos.name/2011/06/google-voice-search/#comments</comments>
		<pubDate>Fri, 17 Jun 2011 06:04:11 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[生活娱乐]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[模式识别]]></category>
		<category><![CDATA[语音识别]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=787</guid>
		<description><![CDATA[今天Google的时候突然发现搜索栏中右边多出了个语音符号： 点击了一下发现出现提示词“请开始说话”，说完之后自动进行语音识别，然后即时搜索。结果让我非常兴奋，因为太精准了，甚至用方言（兰州话）都可以！！有图有真相。 真相1： 真相2： 不过我试了半天谢益辉的名字，结果木有识别出来。 什么时候笔记本可以设置语音密码啊，开机验证身份时候直接喊一声就完事！ 随机日志2009/03/25 -- 相关阵的圆圈图升级为围棋图 (0)2009/05/29 -- 第一届R中国会议上了The R Journal第一期 (1)2009/07/13 -- 未选择的路—罗伯特·弗罗斯特 (0)2009/05/19 -- 新购本本&#038;华中数模竞赛结果 (2)2009/04/21 -- 相关阵的方块图 (0)2009/12/17 -- 用R来玩分形 (11)2009/08/03 -- 凑个热闹，算算14连号的概率 (0)2008/10/14 -- 《R软件与最优化》初稿已定 (2)2009/08/30 -- corrplot即将提交到CRAN (0)2008/10/21 -- 数模成绩 (0)]]></description>
			<content:encoded><![CDATA[<p>今天<a href="http://google.com/ncr" target="_blank">Google</a>的时候突然发现搜索栏中右边多出了个语音符号：<br />
<a href="http://taiyun.cos.name/wp-content/uploads/2011/06/chuhe.png"><img class="aligncenter size-full wp-image-801" title="chuhe" src="http://taiyun.cos.name/wp-content/uploads/2011/06/chuhe.png" alt="" width="684" height="180" /></a></p>
<p>点击了一下发现出现提示词“请开始说话”，说完之后自动进行语音识别，然后即时搜索。结果让我非常兴奋，因为太精准了，甚至用方言（兰州话）都可以！！有图有真相。</p>
<p>真相1：</p>
<p><a href="http://taiyun.cos.name/wp-content/uploads/2011/06/voice.png"><img class="aligncenter size-large wp-image-790" title="voice" src="http://taiyun.cos.name/wp-content/uploads/2011/06/voice-1024x172.png" alt="" width="695" height="116" /></a></p>
<p>真相2：<br />
<a href="http://taiyun.cos.name/wp-content/uploads/2011/06/yixuan.png"><img class="aligncenter size-large wp-image-791" title="yixuan" src="http://taiyun.cos.name/wp-content/uploads/2011/06/yixuan-1024x411.png" alt="" width="695" height="278" /></a></p>
<p>不过我试了半天谢益辉的名字，结果木有识别出来。</p>
<p>什么时候笔记本可以设置语音密码啊，开机验证身份时候直接喊一声就完事！</p>
<h3  class="related_post_title">随机日志</h3><ul class="related_post"><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2009/12/08 -- <a href="http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/" title="第二届R会议随想">第二届R会议随想</a> (47)</li><li>2009/04/01 -- <a href="http://taiyun.cos.name/2009/04/result-of/" title="美国数模竞赛结果出来了">美国数模竞赛结果出来了</a> (0)</li><li>2009/04/28 -- <a href="http://taiyun.cos.name/2009/04/jiu-zhang/" title="四张机，鸳鸯织就欲双飞。可怜未老头先白。春波碧草，晓寒深处，相对浴红衣">四张机，鸳鸯织就欲双飞。可怜未老头先白。春波碧草，晓寒深处，相对浴红衣</a> (0)</li><li>2008/06/13 -- <a href="http://taiyun.cos.name/2008/06/wisdom-words-in-statistics-and-truth/" title="STATISTICS AND TRUTH 中关于统计学的超级经典语录">STATISTICS AND TRUTH 中关于统计学的超级经典语录</a> (0)</li><li>2009/11/07 -- <a href="http://taiyun.cos.name/2009/11/ten-thousand-jin-per-mu-and-so-called-common-sence-and-epistemology/" title="亩产万斤&#038;所谓常识&#038;认识论">亩产万斤&#038;所谓常识&#038;认识论</a> (5)</li><li>2008/06/11 -- <a href="http://taiyun.cos.name/2008/06/impressions-of-statistical-pitfalls/" title="《统计陷阱》读后感">《统计陷阱》读后感</a> (0)</li><li>2009/05/19 -- <a href="http://taiyun.cos.name/2009/05/new-laptop-and-the-result-of-central-china-mcm/" title="新购本本&#038;华中数模竞赛结果">新购本本&#038;华中数模竞赛结果</a> (2)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li><li>2009/04/21 -- <a href="http://taiyun.cos.name/2009/04/squares-chart-of-correlation-matrix/" title="相关阵的方块图">相关阵的方块图</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2011/06/google-voice-search/feed/</wfw:commentRss>
		<slash:comments>12</slash:comments>
		</item>
		<item>
		<title>中科大之行及数据挖掘竞赛小总结</title>
		<link>http://taiyun.cos.name/2011/05/summary-of-first-data-mining-competition/</link>
		<comments>http://taiyun.cos.name/2011/05/summary-of-first-data-mining-competition/#comments</comments>
		<pubDate>Mon, 09 May 2011 17:17:45 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[数据挖掘]]></category>
		<category><![CDATA[生活娱乐]]></category>
		<category><![CDATA[中科大]]></category>
		<category><![CDATA[张伟平]]></category>
		<category><![CDATA[花千树]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=768</guid>
		<description><![CDATA[刚从合肥回来，参加了第一届数据挖掘邀请赛答辩。除了之后的一些琐碎的扫尾工作，数据挖掘这事终于可以消停下来了。 本次数据挖掘邀请赛是科大统计建模赛的一次升华，也是数据挖掘方面全国性竞赛的第一次尝试。反观整个比赛，总体而言还算是比较成功的，个人总结的一些原因如下（原因之间不独立且存在交互效应）： 题目很好。体现在两个方面：1. 数据很真实，题目很实在。用的是赞助公司真刀真枪的数据，非常宝贵，很有分析、挖掘的价值。2. 占尽了天时，当下SNS极其火爆，其中推荐系统更是创收赚钱的核心系统之一。 取得了高校师生的大力支持和捧场。最终注册的队伍一共有1115支，抛去无效队伍及马甲，仍然远远高于我们的预期。除了主办方中国科技大学和中国人民大学在比赛组织方面的大力支持之外，我们发现还有很多学校的老师很积极的鼓励学生参加，有些队伍是老师看到了消息鼓励学生参加的，有些队伍的实验室在刚公布得奖消息就贴出了喜报。 有科大、人大、统计之都的各位同学乐意跑腿干活，包括各种琐碎而又必须做的事情，比如和公司、老师、参赛队伍的各种交流。此外，微博、校内、校园BBS、各大论坛上的宣传也使竞赛能让感兴趣的同学及早知道消息，感谢SNS。 得到了上海花千树信息科技有限公司的资金赞助，这点自然也很重要。 当然不足之处也很多，比如 经验不丰富，很多细节没在一开始就考虑周全。比如注册系统太宽松、题目的微调、提交系统的出的一些问题。 目前竞赛还处于探索性阶段，没有像数学建模那样有号召力和影响力，缺乏长期性的、有号召力、有经验的组织者，竞赛还没有形成一个固定的委员会来常年负责此事。 赛事花絮 我们最开始的打算是只限于科大和人大两个发起方参赛，因为组织什么都比较麻烦，但最后才决定开放到所有高校。事先预计的参赛队队伍是30~40个，严重低估了大家的热情！ 刚开始纠结给竞赛取什么名字好，后来觉得还是冠以“全国”比较霸气也符合实际，后来也证实这一点。我们希望以后这个赛事能成长起来，每次都以一家公司的实际题目为背景，让更多学生都乐于参加，这样起点就会比数学建模高很多（数模的很多题目都很烂）。 有好些海外学生、海外老师要以及业界人士要求参赛（有些只是为了索求数据），但出于保密、比赛经费等原因，还是很不好意思地拒绝了。 注册队伍数目1115个，其中有效注册队伍在1000左右。当然在这1000个左右队伍中，有相当一部分是纯粹下载数据的，拿到了数据就杳无音讯了；还有一部分是马甲，用来多次在线提交以便测试效果。还有一部分队伍是做得不好，没有在线提交结果。 公司给我们的是现金，当初和林妹妹背了个书包去拿钱，觉得一大推钱背起来挺舒服惬意的~~当然现在已经花光啦 此外，很感谢中科大统计与金融系师生的款待，他们都很随和、热情，没有距离感。尤其是张伟平老师，非常随和，我们和他在一起感觉和朋友一样，毫不拘束，并且还开车送我们去机场:) &#8230;&#8230;  张老师的主页在此：http://staff.ustc.edu.cn/~zwp/ ，其中教学链接中给出了他上过的课的电子材料，非常赞。我在本科的时候就发现了，没想到可以如此有缘，世界着实很小~ &#160; #########################跑题说囧事##################### XX领导从合肥回北京的机票是我订的，但很狗血的是：我把票给订反了，弄成了北京到合肥！！他到了机场才发现（我们不是一个航班），只好再买张全价票了（幸好还有）。我这两天看见他都一直胆战心惊的（其实XX一直很淡定+和蔼），这么愚蠢可笑的错误肯定一辈子都忘不掉了。 相关文章2009/05/13 -- R和回归肉的故事 (0)]]></description>
			<content:encoded><![CDATA[<p>刚从合肥回来，参加了第一届数据挖掘邀请赛答辩。除了之后的一些琐碎的扫尾工作，数据挖掘这事终于可以消停下来了。</p>
<p style="text-align: center;"><a href="http://8huoyg.bay.livefilestore.com/y1piq8eFSuBIWNVmoTqjvCELFD0Dtmp62eDVRnxgGEOyWPuqf5k0IkXWcmHScb5zTF5v3wNKDOFH5n43ihT1BZaR5emPfR8Cpzq/%E5%BB%BA%E6%A8%A1%E7%AD%94%E8%BE%A9%20115.jpg" target="_blank"><img class="aligncenter" title="领奖" src="http://8huoyg.bay.livefilestore.com/y1piq8eFSuBIWNVmoTqjvCELFD0Dtmp62eDVRnxgGEOyWPuqf5k0IkXWcmHScb5zTF5v3wNKDOFH5n43ihT1BZaR5emPfR8Cpzq/%E5%BB%BA%E6%A8%A1%E7%AD%94%E8%BE%A9%20115.jpg" alt="" width="640" height="427" /></a></p>
<p>本次数据挖掘邀请赛是科大统计建模赛的一次升华，也是数据挖掘方面全国性竞赛的第一次尝试。反观整个比赛，总体而言还算是比较成功的，个人总结的一些原因如下（原因之间不独立且存在交互效应）：</p>
<ul>
<li>题目很好。体现在两个方面：1. 数据很真实，题目很实在。用的是赞助公司真刀真枪的数据，非常宝贵，很有分析、挖掘的价值。2. 占尽了天时，当下SNS极其火爆，其中推荐系统更是创收赚钱的核心系统之一。</li>
<li>取得了高校师生的大力支持和捧场。最终注册的队伍一共有1115支，抛去无效队伍及马甲，仍然远远高于我们的预期。除了主办方中国科技大学和中国人民大学在比赛组织方面的大力支持之外，我们发现还有很多学校的老师很积极的鼓励学生参加，有些队伍是老师看到了消息鼓励学生参加的，有些队伍的实验室在刚公布得奖消息就贴出了喜报。</li>
<li>有科大、人大、统计之都的各位同学乐意跑腿干活，包括各种琐碎而又必须做的事情，比如和公司、老师、参赛队伍的各种交流。此外，微博、校内、校园BBS、各大论坛上的宣传也使竞赛能让感兴趣的同学及早知道消息，感谢SNS。</li>
<li>得到了上海花千树信息科技有限公司的资金赞助，这点自然也很重要。</li>
</ul>
<p>当然不足之处也很多，比如</p>
<ul>
<li>经验不丰富，很多细节没在一开始就考虑周全。比如注册系统太宽松、题目的微调、提交系统的出的一些问题。</li>
<li>目前竞赛还处于探索性阶段，没有像数学建模那样有号召力和影响力，缺乏长期性的、有号召力、有经验的组织者，竞赛还没有形成一个固定的委员会来常年负责此事。</li>
</ul>
<p>赛事花絮</p>
<ul>
<li>我们最开始的打算是只限于科大和人大两个发起方参赛，因为组织什么都比较麻烦，但最后才决定开放到所有高校。事先预计的参赛队队伍是30~40个，严重低估了大家的热情！</li>
<li>刚开始纠结给竞赛取什么名字好，后来觉得还是冠以“全国”比较霸气也符合实际，后来也证实这一点。我们希望以后这个赛事能成长起来，每次都以一家公司的实际题目为背景，让更多学生都乐于参加，这样起点就会比数学建模高很多（数模的很多题目都很烂）。</li>
<li>有好些海外学生、海外老师要以及业界人士要求参赛（有些只是为了索求数据），但出于保密、比赛经费等原因，还是很不好意思地拒绝了。</li>
<li>注册队伍数目1115个，其中有效注册队伍在1000左右。当然在这1000个左右队伍中，有相当一部分是纯粹下载数据的，拿到了数据就杳无音讯了；还有一部分是马甲，用来多次在线提交以便测试效果。还有一部分队伍是做得不好，没有在线提交结果。</li>
<li>公司给我们的是现金，当初和林妹妹背了个书包去拿钱，觉得一大推钱背起来挺舒服惬意的~~当然现在已经花光啦</li>
</ul>
<p>此外，很感谢中科大统计与金融系师生的款待，他们都很随和、热情，没有距离感。尤其是张伟平老师，非常随和，我们和他在一起感觉和朋友一样，毫不拘束，并且还开车送我们去机场:) &#8230;&#8230;  张老师的主页在此：<a href="http://staff.ustc.edu.cn/~zwp/">http://staff.ustc.edu.cn/~zwp/</a> ，其中<a href="http://staff.ustc.edu.cn/~zwp/teach.htm" target="_blank">教学链接</a>中给出了他上过的课的电子材料，非常赞。我在本科的时候就发现了，没想到可以如此有缘，世界着实很小~</p>
<p>&nbsp;</p>
<p><span style="color: #008000;"><strong>#########################跑题说囧事#####################</strong></span></p>
<p>XX领导从合肥回北京的机票是我订的，但很狗血的是：我把票给订反了，弄成了北京到合肥！！他到了机场才发现（我们不是一个航班），只好再买张全价票了（幸好还有）。我这两天看见他都一直胆战心惊的（其实XX一直很淡定+和蔼），这么愚蠢可笑的错误肯定一辈子都忘不掉了。</p>
<h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2009/05/13 -- <a href="http://taiyun.cos.name/2009/05/r-and-regression/" title="R和回归肉的故事">R和回归肉的故事</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2011/05/summary-of-first-data-mining-competition/feed/</wfw:commentRss>
		<slash:comments>16</slash:comments>
		</item>
		<item>
		<title>第四届R会议, R与最优化</title>
		<link>http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/</link>
		<comments>http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/#comments</comments>
		<pubDate>Tue, 03 May 2011 12:56:39 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[数学建模]]></category>
		<category><![CDATA[生活娱乐]]></category>
		<category><![CDATA[R会议]]></category>
		<category><![CDATA[最优化]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=755</guid>
		<description><![CDATA[##很意识流，很乱。不忍心看的读者直接下载最后的文章吧 转眼间，R会议已经从第一届办到了第四届，时间过得真快！ 我之前参加过第一、二届中国R会议，觉得它为广大国内R用户提供了一个交流沟通的舞台，在这个舞台上，大家交流的最多的并不是R本身的技巧，而是面对某一个学术问题或者实际问题，强调问题分析和解决方法，而不是语言本身；并且整个社区都是其乐融融，很让人温馨感动的。我想这一点是很重要的，否则单纯一个语言什么的肯定没什么太多乐子。当然，各行各业的useR朋友们能因此契机聚在一起，聆听下自己不熟悉领域的朋友们面对的数据分析任务以及解决方案也是很能开阔眼界的。R本身只是一个软件或者语言，但由于设计理念以及其开源免费等特点，越来越多的数据分析方法在R上得以实现，也因为这个原因，R也已成长为一个平台环境。 记得我第一次参加中国R会议的时候还是诚惶诚恐的，怕自己讲的东西太肤浅被人笑话。好在组委会以及COS论坛上的朋友们都极为热心，在他们的怂恿撺掇之下才敢去献丑。而今天，我突然华丽转身成了会议的打杂人员之一，觉得很是诡异，很是离奇。 记得当初还写了一篇R和最优化的小文章，曾经想着多多充实一下，最终以比较完整的形式放出来（还想过出版什么的）。但后来事情越来越多，拖了很长时间，如今只好公开出来下载，欢迎大家批评指正。后面的旅游路线地图是截取自该文，表示TSP形式游玩中国34个省级行政中心的最短路线（只考虑球面距离，飞机路线应该差不多能符合图中要求），我觉得这个图还比较好玩，故贴上来乐一乐。 最后，欢迎大家参加第四届R会议，期待能听到大家的精彩演讲。 《R软件在最优化中的应用》GitHub主页(包括PDF文档下载) &#160; &#160; &#160; 相关文章2008/10/14 -- 《R软件与最优化》初稿已定 (2)2011/12/09 -- 中小矩阵的可视化: corrplot 更新至 0.60 (5)2011/10/22 -- 秋雨梧桐叶落时: corrplot包0.40版本出炉 (12)2011/04/20 -- EBImage包以及学术模特Lena的八卦 (4)2011/04/13 -- 周总理与小波分析 (小波分析连载系列之零) (12)2010/05/29 -- 相关矩阵中置信区间之涂鸦 (10)2009/12/17 -- 用R来玩分形 (11)2009/12/14 -- 第二届R会议那些事儿(上海) (25)2009/12/08 -- 第二届R会议随想 (47)2009/08/30 -- corrplot即将提交到CRAN (0)]]></description>
			<content:encoded><![CDATA[<p><span style="color: #008000;"><strong>##很意识流，很乱。不忍心看的读者直接下载最后的文章吧</strong></span></p>
<p>转眼间，R会议已经从<a href="http://cos.name/2008/12/1st-chinese-r-conference-summary/" target="_blank">第一届</a>办到了<a href="http://cos.name/2011/04/chinar-2011/" target="_blank">第四届</a>，时间过得真快！</p>
<p>我之前参加过第一、二届中国R会议，觉得它为广大国内R用户提供了一个交流沟通的舞台，在这个舞台上，大家交流的最多的并不是R本身的技巧，而是面对某一个学术问题或者实际问题，强调问题分析和解决方法，而不是语言本身；并且整个社区都是其乐融融，很让人温馨感动的。我想这一点是很重要的，否则单纯一个语言什么的肯定没什么太多乐子。当然，各行各业的useR朋友们能因此契机聚在一起，聆听下自己不熟悉领域的朋友们面对的数据分析任务以及解决方案也是很能开阔眼界的。R本身只是一个软件或者语言，但由于设计理念以及其开源免费等特点，<a href="http://cran.r-project.org/web/views/" target="_blank">越来越多的数据分析方法在R上得以实现</a>，也因为这个原因，R也已成长为一个平台环境。</p>
<p>记得我第一次参加中国R会议的时候还是诚惶诚恐的，怕自己讲的东西太肤浅被人笑话。好在组委会以及COS论坛上的朋友们都极为热心，在他们的怂恿撺掇之下才敢去献丑。而今天，我突然华丽转身成了会议的打杂人员之一，觉得很是诡异，很是离奇。</p>
<p>记得当初还写了一篇R和最优化的小文章，曾经想着多多充实一下，最终以比较完整的形式放出来（还想过出版什么的）。但后来事情越来越多，拖了很长时间，如今只好公开出来下载，欢迎大家批评指正。后面的旅游路线地图是截取自该文，表示TSP形式游玩中国34个省级行政中心的最短路线（只考虑球面距离，飞机路线应该差不多能符合图中要求），我觉得这个图还比较好玩，故贴上来乐一乐。</p>
<p>最后，欢迎大家参加第四届R会议，期待能听到大家的精彩演讲。</p>
<p><a href="https://github.com/taiyun/Optimization-using-R" target="_blank">《R软件在最优化中的应用》GitHub主页</a>(包括PDF文档下载)</p>
<p>&nbsp;</p>
<p><a href="http://public.bay.livefilestore.com/y1pEpE5PTo-EH-G5EDmILwb69DMIepBUa_dLz2C_1QsjpdvrOMDJdSFc4K3UN0BaXRufP2sCu8jmJLfJ2AJ59z-mQ/TravelChina.png?psid=1"><img class="aligncenter" title="玩遍中国" src="http://public.bay.livefilestore.com/y1pEpE5PTo-EH-G5EDmILwb69DMIepBUa_dLz2C_1QsjpdvrOMDJdSFc4K3UN0BaXRufP2sCu8jmJLfJ2AJ59z-mQ/TravelChina.png?psid=1" alt="" width="851" height="681" /></a></p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2008/10/14 -- <a href="http://taiyun.cos.name/2008/10/using-r-to-solve-optimization-problems/" title="《R软件与最优化》初稿已定">《R软件与最优化》初稿已定</a> (2)</li><li>2011/12/09 -- <a href="http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/" title="中小矩阵的可视化: corrplot 更新至 0.60">中小矩阵的可视化: corrplot 更新至 0.60</a> (5)</li><li>2011/10/22 -- <a href="http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/" title="秋雨梧桐叶落时: corrplot包0.40版本出炉">秋雨梧桐叶落时: corrplot包0.40版本出炉</a> (12)</li><li>2011/04/20 -- <a href="http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/" title="EBImage包以及学术模特Lena的八卦">EBImage包以及学术模特Lena的八卦</a> (4)</li><li>2011/04/13 -- <a href="http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/" title="周总理与小波分析 (小波分析连载系列之零)">周总理与小波分析 (小波分析连载系列之零)</a> (12)</li><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2009/12/17 -- <a href="http://taiyun.cos.name/2009/12/using-r-to-play-fractal-geometry/" title="用R来玩分形">用R来玩分形</a> (11)</li><li>2009/12/14 -- <a href="http://taiyun.cos.name/2009/12/all-about-the-2nd-r-conference/" title="第二届R会议那些事儿(上海)">第二届R会议那些事儿(上海)</a> (25)</li><li>2009/12/08 -- <a href="http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/" title="第二届R会议随想">第二届R会议随想</a> (47)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>EBImage包以及学术模特Lena的八卦</title>
		<link>http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/</link>
		<comments>http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/#comments</comments>
		<pubDate>Wed, 20 Apr 2011 15:04:08 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[图像处理]]></category>
		<category><![CDATA[生活娱乐]]></category>
		<category><![CDATA[EBImage]]></category>
		<category><![CDATA[Lena]]></category>
		<category><![CDATA[pi]]></category>
		<category><![CDATA[八卦]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=737</guid>
		<description><![CDATA[之前R中一直用rimage包读图，但rimage功能较弱，并且早已被作者抛弃，成为无人照料的孤包。今天在寻找Lena数据的时候发现了一个R包 EBImage，非常好用，可以读取很多种格式的文件（通过ImageMagick），并且定制了一个非常适合查看图片的窗口；更重要的是这个包还包含了一些图像处理方面的算法，包括特征提取等。EBImage是放在Bioconductor上的，依赖于ImageMagick (&#62;= 6.3.7)和GTK+ (&#62; 2.6)，安装方法、介绍等文件见此。 Lena是个非常漂亮的瑞典模特，本来与数字图像处理等学术领域八竿子打不着。但是她的一次在花花公子杂志上的高调亮相，使她从此成为学术paper中玉照曝光率最高的女人（没有之一）：因为她的那张图的上半身从此成为数字图像处理中的标准图像，被该领域的所有学者曾经用来测试自己的算法等（当然在测试的时候有可能也YY一下）。David C.Munson认为Lena这张图如此走红有两大原因： 这张图像包含了各种细节、平滑区域、阴影和纹理，对测试各种图像处理算法很有用。它是一副很好的测试图像！ Lena图像里是一个很迷人的女子。所以不必奇怪图像处理领域里的人（大部分为男性）被一副迷人的图像吸引。 不仅如此，Lena还于1997年被邀请为嘉宾，参加了数字图像科学技术50周年学术会议。在会议上，她成了最受欢迎的人之一，她做了发言，并被无数的粉丝索取签名。在这些粉丝眼中，Lena可能不仅仅是一位漂亮的模特，或许更是一种学术情感的寄托。这不知会让多少该行业的女研究员们艳羡嫉妒啊~ 八卦之后，简单给出EBImage包读图的例子，大家可以观察一下窗口界面。 require("EBImage") ## 绘制Lena lenac = readImage(system.file("images", "lena-color.png", package="EBImage")) display(lenac) ## 读取网络图像pi并绘制 XXlogo &#60;- readImage("http://t.cn/hdqPPd") display(XXlogo) 相关文章2011/12/09 -- 中小矩阵的可视化: corrplot 更新至 0.60 (5)2011/10/22 -- 秋雨梧桐叶落时: corrplot包0.40版本出炉 (12)2011/05/03 -- 第四届R会议, R与最优化 (7)2011/04/13 -- 周总理与小波分析 (小波分析连载系列之零) (12)2010/05/29 -- 相关矩阵中置信区间之涂鸦 (10)2009/12/17 -- 用R来玩分形 (11)2009/12/14 -- 第二届R会议那些事儿(上海) (25)2009/12/08 <a href='http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>之前R中一直用rimage包读图，但rimage功能较弱，并且早已被作者抛弃，成为无人照料的<a href="http://cran.r-project.org/web/packages/rimage/index.html" target="_blank">孤包</a>。今天在寻找Lena数据的时候发现了一个R包 EBImage，非常好用，可以读取很多种格式的文件（通过ImageMagick），并且定制了一个非常适合查看图片的窗口；更重要的是这个包还包含了一些图像处理方面的算法，包括特征提取等。EBImage是放在Bioconductor上的，依赖于ImageMagick (&gt;= 6.3.7)和GTK+ (&gt; 2.6)，安装方法、介绍等文件<a href="http://www.bioconductor.org/packages/devel/bioc/html/EBImage.html" target="_blank">见此</a>。</p>
<p><img class="aligncenter" title="强大无敌的学术模特Lena！" src="http://8huoyg.blu.livefilestore.com/y1pxCKNCdWIR_1OY4yEg-SDhCkWniCvoaFa8lHtGIIpibrWjuqCUoumdRux8_2TCzZQsz_Kn_BgF6FQdQ82Xoz-mTFKXFKLT58R/lenac.jpg" alt="" width="566" height="654" /></p>
<p>Lena是个非常漂亮的瑞典模特，本来与数字图像处理等学术领域八竿子打不着。但是她的一次在花花公子杂志上的高调亮相，使她从此成为学术paper中玉照曝光率最高的女人（没有之一）：因为她的那张图的上半身从此成为数字图像处理中的标准图像，被该领域的所有学者曾经用来测试自己的算法等（当然在测试的时候有可能也YY一下）。David C.Munson认为Lena这张图如此走红有两大原因：</p>
<ul>
<li>这张图像包含了各种细节、平滑区域、阴影和纹理，对测试各种图像处理算法很有用。它是一副很好的测试图像！</li>
<li>Lena图像里是一个很迷人的女子。所以不必奇怪图像处理领域里的人（大部分为男性）被一副迷人的图像吸引。</li>
</ul>
<p>不仅如此，Lena还于1997年被邀请为嘉宾，参加了数字图像科学技术50周年学术会议。<a href="http://www-2.cs.cmu.edu/~chuck/lennapg/lenna_visit.html" target="_blank">在会议上</a>，她成了最受欢迎的人之一，她做了发言，并被无数的粉丝索取签名。在这些粉丝眼中，Lena可能不仅仅是一位漂亮的模特，或许更是一种学术情感的寄托。这不知会让多少该行业的女研究员们艳羡嫉妒啊~</p>
<p>八卦之后，简单给出EBImage包读图的例子，大家可以观察一下窗口界面。</p>
<pre class="sh_slang">require("EBImage")
## 绘制Lena
lenac = readImage(system.file("images", "lena-color.png", package="EBImage"))
display(lenac)
## 读取网络图像pi并绘制
XXlogo &lt;- readImage("http://t.cn/hdqPPd")
display(XXlogo)</pre>
<p><img class="aligncenter" src="http://8huoyg.blu.livefilestore.com/y1pPL5A66xlG5d7QB_roj0zFk-TnCGn5nFLTBGjzgER10fwtbTkTUQVKyM6P_xEyVDOeWoohNRs3mCFx5z4PitK59Oc3XXpeVlG/XXlogo.jpg" alt="" width="509" height="575" /></p>
<script type="text/javascript" src="/wp-content/plugins/shjs-syntax-hiliter/shjs/lang/sh_slang.js"></script><h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2011/12/09 -- <a href="http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/" title="中小矩阵的可视化: corrplot 更新至 0.60">中小矩阵的可视化: corrplot 更新至 0.60</a> (5)</li><li>2011/10/22 -- <a href="http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/" title="秋雨梧桐叶落时: corrplot包0.40版本出炉">秋雨梧桐叶落时: corrplot包0.40版本出炉</a> (12)</li><li>2011/05/03 -- <a href="http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/" title="第四届R会议, R与最优化">第四届R会议, R与最优化</a> (7)</li><li>2011/04/13 -- <a href="http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/" title="周总理与小波分析 (小波分析连载系列之零)">周总理与小波分析 (小波分析连载系列之零)</a> (12)</li><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2009/12/17 -- <a href="http://taiyun.cos.name/2009/12/using-r-to-play-fractal-geometry/" title="用R来玩分形">用R来玩分形</a> (11)</li><li>2009/12/14 -- <a href="http://taiyun.cos.name/2009/12/all-about-the-2nd-r-conference/" title="第二届R会议那些事儿(上海)">第二届R会议那些事儿(上海)</a> (25)</li><li>2009/12/08 -- <a href="http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/" title="第二届R会议随想">第二届R会议随想</a> (47)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li><li>2009/08/23 -- <a href="http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/" title="距离矩阵可视化&#038;用TSP方法重排变量">距离矩阵可视化&#038;用TSP方法重排变量</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>周总理与小波分析 (小波分析连载系列之零)</title>
		<link>http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/</link>
		<comments>http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/#comments</comments>
		<pubDate>Wed, 13 Apr 2011 15:01:30 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[概率统计]]></category>
		<category><![CDATA[生活娱乐]]></category>
		<category><![CDATA[wavelet]]></category>
		<category><![CDATA[wavethresh]]></category>
		<category><![CDATA[周恩来]]></category>
		<category><![CDATA[小波分析]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=716</guid>
		<description><![CDATA[最近想稍微窥探一下统计中的小波分析之应用，找了本英国Bristol大学G.P. NASON写的Wavelet Methods in Statistics with R。不过翻开前言后，发现竟然出现了周恩来总理的赫赫大名，很是惊讶。细一看，原来是作者引用总理的话来进行类比说理，很佩服Nason渊博的历史知识啊。 随便翻译一下，中译文后面附上原文以正视听： 中国总理（1947-1976）周恩来先生在被问及他对法国大革命观点的时候如此回答，“现在评论还为时过早”；我觉得这个说法也同样适应于小波分析。尽管一些特殊小波的发现已经很有些历史了，但是真正能被称之为“小波理论”的主体架构的建立才仅仅是上个世纪80年代的事情。统计学中引入小波分析是在80年代末和90年代初，最初主要在曲线估计方面比较流行，后来以各种方式逐渐渗透到许多领域，比如生存分析、时间序列分析、图像处理、逆问题、变异数稳定变换等。 When Zhou Enlai, Premier of the People’s Republic of China (1949–1976), was asked his opinion of the French Revolution (1789–1799) he replied “It’s too early to tell”, see Rosenberg (1999). I believe that the same can be said about wavelets. Although particular wavelets were discovered many <a href='http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>最近想稍微窥探一下统计中的小波分析之应用，找了本英国Bristol大学G.P. NASON写的Wavelet Methods in Statistics with R。不过翻开前言后，发现竟然出现了周恩来总理的赫赫大名，很是惊讶。细一看，原来是作者引用总理的话来进行类比说理，很佩服Nason渊博的历史知识啊。</p>
<p><img class="aligncenter" src="http://books.gigaimg.com/avaxhome/28/a6/000fa628_medium.jpeg" alt="" width="199" height="300" /></p>
<p>随便翻译一下，中译文后面附上原文以正视听：</p>
<blockquote><p>中国总理（1947-1976）周恩来先生在被问及他对法国大革命观点的时候如此回答，“现在评论还为时过早”；我觉得这个说法也同样适应于小波分析。尽管一些特殊小波的发现已经很有些历史了，但是真正能被称之为“小波理论”的主体架构的建立才仅仅是上个世纪80年代的事情。统计学中引入小波分析是在80年代末和90年代初，最初主要在曲线估计方面比较流行，后来以各种方式逐渐渗透到许多领域，比如生存分析、时间序列分析、图像处理、逆问题、变异数稳定变换等。</p>
<p>When Zhou Enlai, Premier of the People’s Republic of China (1949–1976), was asked his opinion of the French Revolution (1789–1799) he replied “It’s too early to tell”, see Rosenberg (1999). I believe that the same can be said about wavelets. Although particular wavelets were discovered many years ago, the substantial body of literature that we might today call ‘wavelet theory’ began to be established during the 1980s. Wavelets were introduced into statistics during the late 1980s and early 1990s, and they were initially popular in the curve estimation literature. From there they spread in different ways to many areas such as survival analysis, statistical time series analysis, statistical image processing, inverse problems, and variance stabilization.</p></blockquote>
<p>后面的一段就简述了傅里叶级数的曲折历史和对小波分析的肯定与憧憬。傅里叶的那篇开天辟地巨作也着实命运忐忑，这篇论文经 J.-L.拉格朗日, P.-S.拉普拉斯, A.-M.勒让德等著名数学家审查，由于文中初始温度展开为三角级数的提法与拉格朗日关于三角级数的观点相矛盾，而遭拒绝。由于拉格朗日的强烈反对，傅里叶的论文无以得见天日。1811年傅立叶又提交了他修改后的论文，在里面提出了傅立叶级数和傅立叶积分的创新思想和方法，因而这篇关于热传导问题论文获得了1812年科学院大奖，但是这篇论文因为在论证方面仍然缺乏严密性而未能在科学院的院刊《科学院报告》上正式发表。傅里叶自然对此极为愤懑，但也别无他法。直到他1817年被选为科学院院士，并于1822年成为科学院的终身秘书后，才将他的这篇大作原封不动的放在了他的专著《热的解析理论》中。</p>
<blockquote><p>法国大革命也是傅里叶级数引入的大历史背景；傅里叶级数引入之后，招来了科研界的各种尖锐的批评（参见Westheimer (2001)）。尽管早期存在如此之多的争议，但我们发现在200年后，许多新的傅里叶方法如雨后春笋般的在各个领域中生根发芽。无疑，小波也是科学界的一次革命。它的许多有趣的特点很快得到了认可和欣赏，比如多尺度性、局部性、计算速度等。但其他一些重要问题（比如无条件基），还有待进一步研究。我希望本书能在较小的层面上创建一些新的小波方法。我也坚信小波分析将会在接下来的200年凸显其重要性并继续蓬勃发展。</p>
<p>The French Revolution was also the historical backdrop for the introduction of Fourier series which itself raised considerable objections from the scientific establishment of the day, see Westheimer (2001). Despite those early objections, we find that, 200 years later, many new Fourier techniques are regularly being invented in many different fields. Wavelets are also a true scientific revolution. Some of their interesting features are easy to appreciate: e.g., multiscale, localization, or speed. Other important aspects, such as the unconditional basis property, deserve to be better known. I hope that this book, in some small way, enables the creation of many new wavelet methods. Wavelet methods will be developed and important for another 200 years!</p></blockquote>
<p>该书作者还写了个小波分析方面的R包wavethresh，为广大R用户提供了很大的便捷。里面有个图像数据颇为可爱，鄙人岂敢独享？奇图共欣赏，故放上来以飨大家。当然，本系列的后续博文会经常提到这只小熊的，并对其进行各种变换。</p>
<pre class="sh_slang">library("wavethresh")
data(teddy)
par(mar=c(0,0,0,0))
image(teddy)</pre>
<p style="text-align: center;"><a href="http://8huoyg.blu.livefilestore.com/y1pZXaJ-VmjHqk9eCCdVCZ5jLpC6lpLWWNiT_keKvGNnEDnbuTb5eJMqHIHywIuPfWIOTlBHkHKiDR1gCu1FSA9cioTdLcvHZGH/teddy.png" target="_blank"><img class="aligncenter" title="teddy 小熊和它的咖啡杯" src="http://8huoyg.blu.livefilestore.com/y1pZXaJ-VmjHqk9eCCdVCZ5jLpC6lpLWWNiT_keKvGNnEDnbuTb5eJMqHIHywIuPfWIOTlBHkHKiDR1gCu1FSA9cioTdLcvHZGH/teddy.png" alt="" width="500" height="500" /></a></p>
<p>&nbsp;</p>
<p>PS1： 关于教科书中出现政治人物，恐怕太祖是空前绝后了，一个精彩案例<a title="V5" href="http://tieba.baidu.com/f?z=722138798&amp;ct=335544320&amp;lm=0&amp;sc=0&amp;rn=30&amp;tn=baiduPostBrowser&amp;word=%CA%FD%D1%A7&amp;pn=0" target="_blank">在此</a>。</p>
<p>PS2：本博文纯属八卦，故小波分析系列号为零。后续博文会逐步讨论本人对小波分析的一些学习心得；不妥之处，还请大家多多莅临指点。</p>
<p>PS3：这个博客几乎一年没有更新了，从今日起会时常抽空写点东西，多做总结；这一年也是我事情最多的一年，感谢陪伴我、鼓励我、关心我的各位朋友和老师~~~</p>
<script type="text/javascript" src="/wp-content/plugins/shjs-syntax-hiliter/shjs/lang/sh_slang.js"></script><h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2011/12/09 -- <a href="http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/" title="中小矩阵的可视化: corrplot 更新至 0.60">中小矩阵的可视化: corrplot 更新至 0.60</a> (5)</li><li>2011/10/22 -- <a href="http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/" title="秋雨梧桐叶落时: corrplot包0.40版本出炉">秋雨梧桐叶落时: corrplot包0.40版本出炉</a> (12)</li><li>2011/05/03 -- <a href="http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/" title="第四届R会议, R与最优化">第四届R会议, R与最优化</a> (7)</li><li>2011/04/20 -- <a href="http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/" title="EBImage包以及学术模特Lena的八卦">EBImage包以及学术模特Lena的八卦</a> (4)</li><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2009/12/17 -- <a href="http://taiyun.cos.name/2009/12/using-r-to-play-fractal-geometry/" title="用R来玩分形">用R来玩分形</a> (11)</li><li>2009/12/14 -- <a href="http://taiyun.cos.name/2009/12/all-about-the-2nd-r-conference/" title="第二届R会议那些事儿(上海)">第二届R会议那些事儿(上海)</a> (25)</li><li>2009/12/08 -- <a href="http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/" title="第二届R会议随想">第二届R会议随想</a> (47)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li><li>2009/08/23 -- <a href="http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/" title="距离矩阵可视化&#038;用TSP方法重排变量">距离矩阵可视化&#038;用TSP方法重排变量</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/feed/</wfw:commentRss>
		<slash:comments>12</slash:comments>
		</item>
		<item>
		<title>相关矩阵中置信区间之涂鸦</title>
		<link>http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/</link>
		<comments>http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/#comments</comments>
		<pubDate>Sat, 29 May 2010 05:40:30 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[可视分析]]></category>
		<category><![CDATA[animation]]></category>
		<category><![CDATA[CI]]></category>
		<category><![CDATA[corrplot]]></category>
		<category><![CDATA[可视化]]></category>
		<category><![CDATA[涂鸦]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=633</guid>
		<description><![CDATA[先来一个绣花枕头（并非贬义）版本，当置信上下界（下图中为95%）同正同负时，勾勒一个圆环，外圈所围面积为置信上界，内圈所围面积为置信下界。当置信上界和下界符号不同时，画两个圆，先画绝对值较大的，再画绝对值较小的，并用不同颜色以示区分-，这样以来，上下界皆可看清，并且跨越0的置信区间对应的图就不是圆环了。图中的红叉表示不显著的系数(a=0.05)。 上图看来新奇，但展示置信区间还是用长度直观明了，下图为不同置信水平下置信区间的动画演示。每个矩形上下边的黑线分别为上下置信界，中间的黑线（并不是上下界的均值！）为相关系数大小，水平的点划线为0基准线。随着置信水平（1-a）的增大，置信区间长度不断增大。 该gif动画较大，440k左右，网速慢的可能得稍候几秒，pdf版本见此。 更多例图，参见我的Google Docs，共56张图形，恰合我华夏名族之数目(美其名曰corrplot华夏图？）。国内google docs 在线查看速度可能比较慢，下载后用pdf浏览器全屏观看效果为佳。 上面的所有图片代码都在corrplot-0.3版本之中，目前还没有在CRAN上，Rforge估计还得一两天。(注：现在已在了) 近来生成swf、gif等动画都是animation之功劳，很是方便，感谢YH:) &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;分割之&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; corrplot 0.3版本变动如下: 1. 发现原来代码有些地方还是累赘，还有小bug，精简并kill 了一下bug，目前没有一个for循环（这种仇视for的心态或许并不好）。 2. 原来变量名起得不好，这次大动了手术，争取见名知意，且能迅速记住，并不发生混淆。 3. 进一步做好细节工作，主要是文本标签和颜色标签，提供了更灵活的布局方式，从上面提到的corrplot华夏图中即可见端倪，比如颜色棒可选择在右或下，并可以自由控制宽度。 目前的corrplot包一个优点是很灵活，可以自由控制很多东西；但同时，这个优点也是成了它最大的缺点，那么多参数，看得人眼花。 相关文章2011/12/09 -- 中小矩阵的可视化: corrplot 更新至 0.60 (5)2011/10/22 -- 秋雨梧桐叶落时: corrplot包0.40版本出炉 (12)2010/05/10 -- 国内三大经济期刊合作作者关系网络及其可视化 (19)2010/04/18 -- corrplot 0.2-0版本出炉 (20)2009/08/30 -- corrplot即将提交到CRAN (0)2009/08/23 -- 距离矩阵可视化&#038;用TSP方法重排变量 (0)2009/04/21 -- 相关阵的方块图 (0)2011/05/03 -- 第四届R会议, R与最优化 (7)2011/04/20 -- EBImage包以及学术模特Lena的八卦 (4)2011/04/13 -- <a href='http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>先来一个绣花枕头<span style="color: #808080;">（并非贬义）</span>版本，当置信上下界<span style="color: #808080;">（下图中为95%）</span>同正同负时，勾勒一个圆环，外圈所围面积为置信上界，内圈所围面积为置信下界。当置信上界和下界符号不同时，画两个圆，先画绝对值较大的，再画绝对值较小的，并用不同颜色以示区分-，这样以来，上下界皆可看清，并且跨越0的置信区间对应的图就不是圆环了。图中的红叉表示不显著的系数<span style="color: #808080;">(a=0.05)</span>。</p>
<p><a href="http://taiyun.cos.name/wp-content/uploads/2010/05/Rplot010.png"><img class="aligncenter size-full wp-image-632" title="置信区间-圆环图" src="http://taiyun.cos.name/wp-content/uploads/2010/05/Rplot010.png" alt="" width="480" height="480" /></a></p>
<p>上图看来新奇，但展示置信区间还是用长度直观明了，下图为不同置信水平下置信区间的动画演示。每个矩形上下边的黑线分别为上下置信界，中间的黑线<span style="color: #808080;">（并不是上下界的均值！）</span>为相关系数大小，水平的点划线为0基准线。随着置信水平<span style="color: #808080;">（1-a）</span>的增大，置信区间长度不断增大。</p>
<p><a href="http://taiyun.cos.name/wp-content/uploads/2010/05/CI21.gif"><img class="aligncenter size-full wp-image-634" title="CI2" src="http://taiyun.cos.name/wp-content/uploads/2010/05/CI21.gif" alt="" width="480" height="480" /></a></p>
<p>该gif动画较大，440k左右，网速慢的可能得稍候几秒，<a href="http://docs.google.com/fileview?id=0Bz0D2DDMGlCeMWUzNjZlMDEtZjVlNi00MTViLWFmOTktZDg5YWM5MjI2MTEw&amp;hl=en" target="_blank">pdf版本见此</a>。</p>
<p>更多例图，<a href="http://docs.google.com/fileview?id=0Bz0D2DDMGlCeNzAwOWIxYzEtOTM3ZS00NzhiLTlhYzAtYzA3ZTQ5YjE4MTY0&amp;hl=en" target="_blank">参见我的Google Docs</a>，共56张图形，恰合我华夏名族之数目<span style="color: #808080;">(美其名曰corrplot华夏图？）</span>。国内google docs 在线查看速度可能比较慢，下载后用pdf浏览器全屏观看效果为佳。</p>
<p>上面的所有图片代码都在corrplot-0.3版本之中，目前还没有在CRAN上，Rforge估计还得一两天。(注：<a href="http://cran.r-project.org/web/packages/corrplot/index.html" target="_blank">现在已在了</a>)</p>
<p>近来生成swf、gif等动画都是animation之功劳，很是方便，感谢YH:)</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;分割之&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<br />
corrplot 0.3版本变动如下:</p>
<blockquote><p><span style="color: #0000ff;">1. 发现原来代码有些地方还是累赘，还有小bug，精简并kill 了一下bug，目前没有一个for循环（这种仇视for的心态或许并不好）。<br />
2. 原来变量名起得不好，这次大动了手术，争取见名知意，且能迅速记住，并不发生混淆。<br />
3. 进一步做好细节工作，主要是文本标签和颜色标签，提供了更灵活的布局方式，从上面提到的<a href="http://docs.google.com/fileview?id=0Bz0D2DDMGlCeNzAwOWIxYzEtOTM3ZS00NzhiLTlhYzAtYzA3ZTQ5YjE4MTY0&amp;hl=en" target="_blank">corrplot华夏图</a>中即可见端倪，比如颜色棒可选择在右或下，并可以自由控制宽度。</span></p></blockquote>
<p>目前的corrplot包一个优点是很灵活，可以自由控制很多东西；但同时，这个优点也是成了它最大的缺点，那么多参数，看得人眼花。</p>
<h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2011/12/09 -- <a href="http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/" title="中小矩阵的可视化: corrplot 更新至 0.60">中小矩阵的可视化: corrplot 更新至 0.60</a> (5)</li><li>2011/10/22 -- <a href="http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/" title="秋雨梧桐叶落时: corrplot包0.40版本出炉">秋雨梧桐叶落时: corrplot包0.40版本出炉</a> (12)</li><li>2010/05/10 -- <a href="http://taiyun.cos.name/2010/05/co-author-network-in-chinese-three-top-journal/" title="国内三大经济期刊合作作者关系网络及其可视化">国内三大经济期刊合作作者关系网络及其可视化</a> (19)</li><li>2010/04/18 -- <a href="http://taiyun.cos.name/2010/04/corrplot-0-20-came-out/" title="corrplot 0.2-0版本出炉">corrplot 0.2-0版本出炉</a> (20)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li><li>2009/08/23 -- <a href="http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/" title="距离矩阵可视化&#038;用TSP方法重排变量">距离矩阵可视化&#038;用TSP方法重排变量</a> (0)</li><li>2009/04/21 -- <a href="http://taiyun.cos.name/2009/04/squares-chart-of-correlation-matrix/" title="相关阵的方块图">相关阵的方块图</a> (0)</li><li>2011/05/03 -- <a href="http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/" title="第四届R会议, R与最优化">第四届R会议, R与最优化</a> (7)</li><li>2011/04/20 -- <a href="http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/" title="EBImage包以及学术模特Lena的八卦">EBImage包以及学术模特Lena的八卦</a> (4)</li><li>2011/04/13 -- <a href="http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/" title="周总理与小波分析 (小波分析连载系列之零)">周总理与小波分析 (小波分析连载系列之零)</a> (12)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/feed/</wfw:commentRss>
		<slash:comments>10</slash:comments>
		</item>
		<item>
		<title>国内三大经济期刊合作作者关系网络及其可视化</title>
		<link>http://taiyun.cos.name/2010/05/co-author-network-in-chinese-three-top-journal/</link>
		<comments>http://taiyun.cos.name/2010/05/co-author-network-in-chinese-three-top-journal/#comments</comments>
		<pubDate>Mon, 10 May 2010 11:44:07 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[可视分析]]></category>
		<category><![CDATA[复杂网络]]></category>
		<category><![CDATA[数据挖掘]]></category>
		<category><![CDATA[animation]]></category>
		<category><![CDATA[fastgreedy.community()]]></category>
		<category><![CDATA[flash]]></category>
		<category><![CDATA[igraph]]></category>
		<category><![CDATA[SNA]]></category>
		<category><![CDATA[可视化]]></category>
		<category><![CDATA[经济学]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=595</guid>
		<description><![CDATA[最近做毕设，做着做着和社会网络搭上边了，发现这东西很好玩，并且很实用。在丽云的建议下抓取了2004年以来国内三大经济学期刊（经济学季刊、 经济研究、 世界经济）的合作作者数据，在igraph包中用复杂网络领域的大牛Newman等人的速度超快的社团结构分割算法(igraph中是fastgreedy.community()函数)画出了其中一个最大网络 的社团结构图 ，并按照社团数目画了25张图。这张图包括396个作者，652条边。 点击gif图片，可看flash版本，比较清晰。PDF版本在这里，下载后以幻灯片形式全屏来看，一张一张放映比flash版本更舒服，并且可以随时叫停，随时加速。tips：看官注意图中的一些细节，比如形状、主体颜色、轮廓颜色，其中暗藏机关。 再放两个变种： 点击可看flash版本，PDF版本在此：pdf-1，pdf-2。其中加了边框的图是根据散点形成的凸集弄的（chull()函数），有时两个类别的凸几何图形有所重合，不太养眼。加了阴影的图是投机取了巧，把每个节点放大作为背景色的，但是效果还行。 最后，再放个以作者名字为节点标签的图，见此，或次（19个社团的）。可以不用辛辛苦苦根据门牌号对号入座了，不过由于文字较小，可能需要放大查看。 &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;分割之&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; 注1：近五年的数据中包括很多互相独立的子图，这里仅仅画出一个最大的（396个顶点），其他的没有画出，具体细节见下表。 顶点数 1 2 3 4 5 6 7 8 9 11 频数 335 207 102 49 24 17 12 4 4 3 顶点数 12 14 15 16 20 22 23 55 396   频数 2 3 1 1 1 1 1 1 1   <a href='http://taiyun.cos.name/2010/05/co-author-network-in-chinese-three-top-journal/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>最近做毕设，做着做着和社会网络搭上边了，发现这东西很好玩，并且很实用。在<a href="http://www.loyhome.cn/" target="_blank">丽云</a>的建议下抓取了2004年以来国内三大经济学期刊<span style="color: #888888;">（经济学季刊、 经济研究、 世界经济）</span>的合作作者数据，在igraph包中用复杂网络领域的大牛<a href="http://www-personal.umich.edu/~mejn/" target="_blank">Newman</a>等人的<a href="http://www.ece.unm.edu/ifis/papers/community-moore.pdf" target="_blank">速度超快的社团结构分割算法</a><span style="color: #888888;">(igraph中是fastgreedy.community()函数)</span>画出了其中一个最大网络<span style="color: #888888;"> </span>的社团结构图<span style="color: #888888;"> </span>，并按照社团数目画了25张图。这张图包括396个作者，652条边。</p>
<div id="attachment_597" class="wp-caption aligncenter" style="width: 490px"><a href="http://taiyun.cos.name/wp-content/uploads/2010/05/igraph25.swf" target="_blank"><img class="size-full wp-image-597  " title="点击看清楚的flash版本" src="http://taiyun.cos.name/wp-content/uploads/2010/05/igraph25.gif" alt="" width="480" height="480" /></a><p class="wp-caption-text">中国三大经济期刊2004年以来合作作者社会网络图之一</p></div>
<p style="text-align: center;">点击gif图片，可看<a href="http://taiyun.cos.name/wp-content/uploads/2010/05/igraph25.swf" target="_blank">flash版本</a>，比较清晰。PDF<a href="https://docs.google.com/fileview?id=0Bz0D2DDMGlCeMWM1Nzk3MTktN2Q3Yy00YzgyLTgyMzItZGEwY2U4N2I4ODZk&amp;hl=en" target="_blank">版本在这里</a>，下载后以幻灯片形式全屏来看，一张一张放映比flash版本更舒服，并且可以随时叫停，随时加速。tips：看官注意图中的一些细节，比如形状、主体颜色、轮廓颜色，其中暗藏机关。</p>
<p>再放两个变种：</p>
<div id="attachment_607" class="wp-caption aligncenter" style="width: 490px"><a href="http://taiyun.cos.name/wp-content/uploads/2010/05/igraph25-block.swf" target="_blank"><img class="size-full wp-image-607 " title="点击看flash版本" src="http://taiyun.cos.name/wp-content/uploads/2010/05/igraph25-block.gif" alt="" width="480" height="480" /></a><p class="wp-caption-text">中国三大经济期刊2004年以来合作作者社会网络图之二</p></div>
<p style="text-align: center;">
<div id="attachment_605" class="wp-caption aligncenter" style="width: 490px"><a href="http://taiyun.cos.name/wp-content/uploads/2010/05/igraph25-shade.swf" target="_blank"><img class="size-full wp-image-605 " title="点击看flash版本" src="http://taiyun.cos.name/wp-content/uploads/2010/05/igraph25-shade.gif" alt="" width="480" height="480" /></a><p class="wp-caption-text">中国三大经济期刊2004年以来合作作者社会网络图之三</p></div>
<p style="text-align: center;">点击可看flash版本，PDF版本在此：<a href="http://docs.google.com/fileview?id=0Bz0D2DDMGlCeOTliY2I2MzMtOTkxZS00MzMzLTkwN2YtYzY2NWZmYmRjNzY0&amp;hl=en" target="_blank">pdf-1</a>，<a href="http://docs.google.com/fileview?id=0Bz0D2DDMGlCeYjY0MGE1ZWUtNjhjZC00N2NiLTg5ZDAtNmMwZDk0M2IzNmY5&amp;hl=en" target="_blank">pdf-2</a>。其中加了边框的图是根据散点形成的凸集弄的<span style="color: #888888;">（chull()函数）</span>，有时两个类别的凸几何图形有所重合，不太养眼。加了阴影的图是投机取了巧，把每个节点放大作为背景色的，但是效果还行。</p>
<p>最后，再放个以作者名字为节点标签的图，<a href="http://docs.google.com/fileview?id=0Bz0D2DDMGlCeN2E2MmYyMzMtYTE5My00NTdjLThkNDEtMWNkYTcwOWU0MDkw&amp;hl=en" target="_blank">见此</a>，<a href="http://docs.google.com/fileview?id=0Bz0D2DDMGlCeZmI0NDYzZTktNzI1NC00ZGFkLTlmNmQtNDY5NmVmY2Y0NWY1&amp;hl=en" target="_blank">或次（19个社团的）。</a>可以不用辛辛苦苦根据门牌号对号入座了，不过由于文字较小，可能需要放大查看。</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;分割之&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;</p>
<p>注1：近五年的数据中包括很多互相独立的子图，这里仅仅画出一个最大的（396个顶点），其他的没有画出，具体细节见下表。</p>
<table style="height: 66px;" border="1" cellspacing="0" cellpadding="0" width="527">
<tbody>
<tr>
<td width="57">顶点数</td>
<td width="57">1</td>
<td width="57">2</td>
<td width="57">3</td>
<td width="57">4</td>
<td width="57">5</td>
<td width="57">6</td>
<td width="57">7</td>
<td width="57">8</td>
<td width="57">9</td>
<td width="57">11</td>
</tr>
<tr>
<td width="57">频数</td>
<td width="57">335</td>
<td width="57">207</td>
<td width="57">102</td>
<td width="57">49</td>
<td width="57">24</td>
<td width="57">17</td>
<td width="57">12</td>
<td width="57">4</td>
<td width="57">4</td>
<td width="57">3</td>
</tr>
<tr>
<td width="57">顶点数</td>
<td width="57">12</td>
<td width="57">14</td>
<td width="57">15</td>
<td width="57">16</td>
<td width="57">20</td>
<td width="57">22</td>
<td width="57">23</td>
<td width="57">55</td>
<td width="57">396</td>
<td width="57"> </td>
</tr>
<tr>
<td width="57">频数</td>
<td width="57">2</td>
<td width="57">3</td>
<td width="57">1</td>
<td width="57">1</td>
<td width="57">1</td>
<td width="57">1</td>
<td width="57">1</td>
<td width="57">1</td>
<td width="57">1</td>
<td width="57"> </td>
</tr>
</tbody>
</table>
<p style="text-align: center;">注2：刚好丽云画了国外经济学期刊的社会网络图，<a href="http://blog.cloudlychen.net/the-social-network-of-economists" target="_blank">见此</a>，<a href="http://www.loyhome.cn/961.html" target="_blank">或此</a>。</p>
<p>注3：该算法表示在社团为19的时候最为合适，图中的聚类信息<span style="color: #888888;">(给出的是在社团数目为19的时候)</span>和IDs代号如下<span style="color: #888888;">(代号越大，发表文章越多，比如樊纲的id是384，林毅夫的id是394，</span><span style="color: #888888;">龚六堂</span><span style="color: #888888;">的是393，都算是刊霸级人物)</span>，希望经济学的朋友们看看是否符合实情：</p>
<ul>
<li>第1类(size=46):</li>
<p>WarwickJ.Mckibbin(7), 蔡志洲(12), 陈烨(20), 陈瑜(21), 关志雄(36), 国务院发展研究中心课题组(39), 胡嘉妮(47), 李宏艳(63), 罗德明(95), 沈懿(105), 史宇鹏(108), 苏剑(112), 陶婧(117), 王荣艳(125), 威廉•布莱福特(137), 魏强(138), 沃维克•麦克吉宾(140), 小川英治(146), 曾道智(166), 张辉(169), 张健华(171), 张艳花(174), 张燕(175), 张永生(176), 陈超(198), 陈漓高(200), 顾全林(214), 金祥荣(224), 刘鹏(231), 刘世锦(232), 罗凯(236), 汪伟(248), 张怀清(271), 胡永泰(287), 朱希伟(313), 齐俊妍(319), 汪淼军(325), 王小鲁(328), 谢平(329), 姚枝仲(332), 贺力平(339), 刘伟(343), 张维迎(348), 朱玲(364), 周黎安(383), 樊纲(384)</p>
<li>第2类(size=42):</li>
<p>丁维莉(25), 何俊志(43), 贺小海(45), 蒋仕卿(58), 李珍珍(75), 齐佩金(100), 宋铮(109), 汪汇(121), 王志强(135), 邢予青(149), 严冀(156), 杨真真(159), 余央央(165), 张藕香(173), 赵剑治(181), 陈敏(201), 邓可斌(205), 樊潇彦(210), 桂琦寒(216), 何立新(219), 何樟勇(220), 刘永平(234), 孙刚(244), 吴桂英(253), 殷醒民(264), 张吉鹏(272), 张爽(275), 丁菊红(285), 金煜(289), 夏纪军(297), 许庆(300), 佐藤宏(314), 刘修岩(318), 袁志刚(333), 封进(337), 张茵(349), 张晏(361), 王永钦(369), 章元(382), 万广华(390), 陈钊(392), 陆铭(395)</p>
<li>第3类(size=39):</li>
<p>蔡颖义(11), 曹广忠(13), 单伟(23), 高坚(32), 何学中(44), 姜烨(57), 雷•布鲁克斯(61), 刘永东(88), 陆曦(94), 邵挺(103), 苏福兵(110), 田士超(118), 王世华(128), 王勇(132), 危结根(136), 吴庆堂(142), 余乐安(164), 冯维江(211), 鞠建东(225), 李志赟(227), 汪晖(247), 徐高(257), 徐晋涛(258), 余永定(266), 袁飞(268), 孙希芳(292), 覃东海(293), 余淼杰(304), 张鹏飞(308), 张斌(334), 龚刚(353), 何帆(354), 徐志刚(359), 张曙光(360), 潘士远(367), 陶然(368), 章奇(374), 刘明兴(379), 林毅夫(394)</p>
<li>第4类(size=33):</li>
<p>冯俊新(30), 黄文平(50), 黄新飞(51), 黄怡胜(52), 江舒韵(54), 李正仕(76), 刘霖林(82), 石晓军(107), 苏桂富(111), 孙建军(113), 夏晓华(145), 徐勇(152), 余军(163), 张安民(167), 周天芸(186), 朱洁瑜(190), 李捷瑜(226), 刘涛(233), 梅松(240), 孙群燕(245), 王红领(249), 王贤彬(251), 张顺明(276), 赵永亮(278), 李稻葵(290), 云鹤(306), 王美今(327), 才国伟(336), 李郇(340), 王曦(358), 李杰(378), 徐现祥(380), 舒元(389)</p>
<li>第5类(size=33):</li>
<p>杜敏杰(26), 黄群慧(49), 李恩平(62), 李琴(69), 李义学(72), 李增刚(74), 林跃勤(79), 罗凤金(96), 吴太昌(143), 张慧莲(170), 张自然(177), 钟宏武(184), 常欣(195), 陈昌兵(197), 韩孟(218), 汤铎铎(246), 王宏淼(250), 谢志平(255), 袁富华(269), 中国社会科学院经济体制改革30年研究课题组(279), 陈佳贵(283), 韦倩(295), 张磊(307), 黄少安(316), 孙涛(322), 汪红驹(324), 王海港(326), 刘树成(342), 张平(372), 张卓元(373), 中国经济增长与宏观稳定课题组(375), 张晓晶(386), 刘霞辉(387)</p>
<li>第6类(size=33):</li>
<p>薄仙慧(10), 黄张凯(53), 姜神怡(56), 康季军(59), 康继军(60), 林细细(78), 林忠晶(80), 刘寅(87), 鲁臻(92), 缪新琼(99), 汪锋(120), 王胜(127), 王燕(131), 肖军(147), 谢丹阳(148), 许雄奇(154), 薛彤(155), 杨云红(158), 周春生(185), 白云霞(193), 尹恒(265), 陈晓光(284), 王弟海(294), 徐信忠(298), 严成樑(301), 杨俊(302), 张宗益(309), 周炎(312), 王亚平(346), 邹恒甫(350), 陈昆亭(351), 吴联生(370), 龚六堂(393)</p>
<li>第7类(size=27):</li>
<p>陈波(16), 韩冰洁(40), 何建武(42), 侯永志(46), 姜德增(55), 李金波(65), 刘云中(90), 卢周来(91), 芮明杰(102), 孙艳梅(115), 王宇锋(133), 吴玉立(144), 杨其静(157), 张俊妮(172), 罗雨泽(238), 行伟波(256), 许召元(260), 薛求知(261), 杨瑞龙(263), 朱善利(281), 罗来军(291), 谭松涛(323), 邢春冰(330), 李善同(341), 陈玉宇(352), 聂辉华(355), 郑志刚(363)</p>
<li>第8类(size=25):</li>
<p>傅雄广(31), 郭凯(37), 郭美新(38), 黄玲文(48), 沈明高(104), 师慧丽(106), 王曲(124), 王小康(130), 王泽填(134), 余海丰(162), 章林峰(178), 赵英涛(182), 郑东雅(183), 朱海婷(188), 朱诗娥(192), 陈斌开(196), 和云(221), 刘民权(230), 沈艳(242), 许伟(259), 徐忠(299), 杨汝岱(331), 高梦滔(338), 施建淮(357), 姚洋(385)</p>
<li>第9类(size=21):</li>
<p>ArneBigsten(1), 高宇宁(33), 刘生龙(83), 刘涛雄(84), 刘晓东(86), 钱陈(101), 孙柳媚(114), 田新民(119), 王少国(126), 吴凡(141), 许海萍(153), 朱慧(189), 杜立民(209), 王亚华(252), 董雪兵(286), 杨永恒(303), 张宁(335), 王争(347), 郑京海(362), 胡鞍钢(376), 史晋川(388)</p>
<li>第10类(size=16):</li>
<p>ErikaMeng(3), MichielKeyzer(6), WillMartin(8), WimvanVeen(9), 刘宇(89), 罗斯高(97), 米建伟(98), 王金霞(123), 朱莉芬(191), 仇焕广(204), 刘承芳(229), 罗仁福(237), 杨军(262), 张林秀(274), ScottRozelle(282), 黄季焜(365)</p>
<li>第11类(size=15):</li>
<p>陈工文(18), 陈敏彦(19), 邓永旭(24), 范瑛(28), 关晓静(35), 郝朝艳(41), 李胤(73), 尹静(160), 章椹元(179), 周艺艺(187), 郭锐欣(217), 梁爽(228), 毛亮(239), 张海洋(270), 平新乔(356)</p>
<li>第12类(size=13):</li>
<p>陈高才(17), 樊茂清(27), 李洁(64), 林黎(77), 覃筱(116), 徐楠楠(151), 余芳东(161), 柏满迎(194), 黄薇(222), 蒋云赟(223), 郑海涛(311), 孙琳琳(321), 任若恩(391)</p>
<li>第13类(size=10):</li>
<p>B•古斯塔夫森(2), 古斯塔夫森(34), 李利英(67), 刘京军(81), 邓曲恒(206), 丁赛(207), 董晓媛(208), 魏众(296), 岳希明(305), 李实(366)</p>
<li>第14类(size=9):</li>
<p>曹跃群(14), 陈仲常(22), 李敬(66), 李伶俐(68), 王定祥(122), 温涛(139), 熊德平(150), 吴永球(254), 冉光和(320)</p>
<li>第15类(size=9):</li>
<p>GaryH.Jefferson(4), 方红生(29), 王世磊(129), 张弘(168), 陈诗一(202), 傅勇(212), 高远(213), 桂林(215), 张军(381)</p>
<li>第16类(size=8):</li>
<p>赵波(180), 陈磊(199), 石磊(243), 张剑(273), 张涛(277), 周敏(280), 王学斌(345), 寇宗来(377)</p>
<li>第17类(size=7):</li>
<p>李双杰(70), 陆挺(235), 袁诚(267), 赵农(310), 刘小鲁(317), 刘小玄(344), 吴延兵(371)</p>
<li>第18类(size=5):</li>
<p>M.S.Qureshi(5), 常斌(15), 李妍(71), 缪小林(241), 伏润民(315)</p>
<li>第19类(size=5):</li>
<p>AbdullahiD.Ahmed(0), 刘西川(85), 陆文聪(93), 程恩江(203), 黄祖辉(288)</ul>
<h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2011/12/09 -- <a href="http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/" title="中小矩阵的可视化: corrplot 更新至 0.60">中小矩阵的可视化: corrplot 更新至 0.60</a> (5)</li><li>2010/04/18 -- <a href="http://taiyun.cos.name/2010/04/corrplot-0-20-came-out/" title="corrplot 0.2-0版本出炉">corrplot 0.2-0版本出炉</a> (20)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li><li>2009/08/23 -- <a href="http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/" title="距离矩阵可视化&#038;用TSP方法重排变量">距离矩阵可视化&#038;用TSP方法重排变量</a> (0)</li><li>2009/04/21 -- <a href="http://taiyun.cos.name/2009/04/squares-chart-of-correlation-matrix/" title="相关阵的方块图">相关阵的方块图</a> (0)</li><li>2009/03/25 -- <a href="http://taiyun.cos.name/2009/03/circles-chart-of-corrmatrix-to-wiqi-chart/" title="相关阵的圆圈图升级为围棋图">相关阵的圆圈图升级为围棋图</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2010/05/co-author-network-in-chinese-three-top-journal/feed/</wfw:commentRss>
		<slash:comments>19</slash:comments>
		</item>
		<item>
		<title>corrplot 0.2-0版本出炉</title>
		<link>http://taiyun.cos.name/2010/04/corrplot-0-20-came-out/</link>
		<comments>http://taiyun.cos.name/2010/04/corrplot-0-20-came-out/#comments</comments>
		<pubDate>Sun, 18 Apr 2010 05:04:48 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[可视分析]]></category>
		<category><![CDATA[Cairo]]></category>
		<category><![CDATA[corrplot]]></category>
		<category><![CDATA[cran]]></category>
		<category><![CDATA[凝聚聚类]]></category>
		<category><![CDATA[可视化]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=577</guid>
		<description><![CDATA[更新了一下corrplot包，变动如下： 1.  解决了之前的一些小bug，并且把原来的一些for()循环用*apply函数重写了一下。 2. 增加了corr.rect()函数，可以在相关阵的图上面框框，类似于谱系图上面的那种矩形，即将原来的多个变量分为n类。这两种图（见图1、图2）可以好好比较一下，各有特点。 3. 在原先的corrpot()函数中，当排序方式为系统聚类时，可以根据聚类结果直接加框框，具体由rect.hc, rect.col, rect.lwd三个参数控制。当然，也可以在图画完之后，用corr.rect()函数再加，只不过方便性上打了折扣。 目前，CRAN主页上新版已经出炉，国内中科院的两个镜像还没有同步，大约得半天左右吧(香港那个镜像早已废弃)。此外，WINDOWS下默认的图形设备在绘制png等非矢量格式图时，效果欠佳，建议用Cairo包或者cairoDevice包来生成质量较高的png图片。 图1代码如下： corrplot(cor(mtcars), order="hclust", rect.hc = 3) 再放一个图1和图2的联姻图： corrplot包的其他问题： 1. DESCRIPTION文件里面的suggests package里面不小心加了个rgl包，悲剧悲剧。 2. corrplot()函数参数过多，现在是38个左右，很多时候我自己都要返回去看看参数意义，显得比较累赘。 3. 变量的文本标签的计算方法不太好，有时得多次调解cex参数，比较麻烦，这个是个比较大的问题。 4. 之前，准备多做做变量排序的事情，后来发现seriation包已经做得非常好了，其中一位作者Kurt还是R core之一，每次提交package时，几乎都是他把关。corrplot包的定位还是轻量级，在维数&#60;50的时候娱乐娱乐。 欢迎广大朋友批评指正。 相关文章2011/12/09 -- 中小矩阵的可视化: corrplot 更新至 0.60 (5)2011/10/22 -- 秋雨梧桐叶落时: corrplot包0.40版本出炉 (12)2010/05/29 -- 相关矩阵中置信区间之涂鸦 (10)2010/05/10 -- 国内三大经济期刊合作作者关系网络及其可视化 (19)2009/08/30 -- corrplot即将提交到CRAN (0)2009/08/23 -- 距离矩阵可视化&#038;用TSP方法重排变量 (0)2009/04/21 -- 相关阵的方块图 (0)2009/03/25 <a href='http://taiyun.cos.name/2010/04/corrplot-0-20-came-out/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>更新了一下corrplot包，变动如下：</p>
<blockquote><p><span style="color: #000080;"><strong><span style="color: #0000ff;">1.  解决了之前的一些小bug，并且把原来的一些for()循环用*apply函数重写了一下。<br />
2. 增加了corr.rect()函数，可以在相关阵的图上面框框，类似于谱系图上面的那种矩形，即将原来的多个变量分为n类。这两种图（见图1、图2）可以好好比较一下，各有特点。<br />
3. 在原先的corrpot()函数中，当排序方式为系统聚类时，可以根据聚类结果直接加框框，具体由rect.hc, rect.col, rect.lwd三个参数控制。当然，也可以在图画完之后，用corr.rect()函数再加，只不过方便性上打了折扣。</span></strong></span></p></blockquote>
<p>目前，<a href="http://cran.r-project.org/web/packages/corrplot/index.html" target="_blank">CRAN主页</a>上新版已经出炉，国内中科院的两个镜像还没有同步，大约得半天左右吧(香港那个镜像早已废弃)。此外，WINDOWS下默认的图形设备在绘制png等非矢量格式图时，效果欠佳，建议用Cairo包或者cairoDevice包来生成质量较高的png图片。</p>
<div id="attachment_578" class="wp-caption aligncenter" style="width: 573px"><a title="图1 代码为：corrplot(cor(mtcars), order=&quot;hclust&quot;, rect.hc = 3)" href="http://taiyun.cos.name/wp-content/uploads/2010/04/corr-circle3.png" target="_blank"><img class="size-full wp-image-578 " title="corr-circle3" src="http://taiyun.cos.name/wp-content/uploads/2010/04/corr-circle3.png" alt="" width="563" height="518" /></a><p class="wp-caption-text">图 1  corrplot画出来的</p></div>
<p style="text-align: center;">
<p style="text-align: center;">
<p>图1代码如下：</p>
<pre class="sh_slang">corrplot(cor(mtcars), order="hclust", rect.hc = 3)</pre>
<p><div id="attachment_579" class="wp-caption aligncenter" style="width: 570px"><a href="http://taiyun.cos.name/wp-content/uploads/2010/04/dent3.png" target="_blank"><img class="size-full wp-image-579       " title="dent3" src="http://taiyun.cos.name/wp-content/uploads/2010/04/dent3.png" alt="" width="560" height="503" /></a><p class="wp-caption-text">图2 传统的聚类谱系图，可以与图1好好比较一番</p></div><br />
再放一个图1和图2的联姻图：</p>
<div id="attachment_625" class="wp-caption aligncenter" style="width: 553px"><a href="http://taiyun.cos.name/wp-content/uploads/2010/04/two2in1.png"><img class="size-full wp-image-625" src="http://taiyun.cos.name/wp-content/uploads/2010/04/two2in1.png" alt="" width="543" height="637" /></a><p class="wp-caption-text">图3 二者之联姻，和heatmap有些相似</p></div>
<p style="text-align: center;">
<p>corrplot包的其他问题：</p>
<blockquote><p><span style="color: #000080;"><strong><span style="color: #0000ff;">1. DESCRIPTION文件里面的suggests package里面不小心加了个rgl包，悲剧悲剧。<br />
2. corrplot()函数参数过多，现在是38个左右，很多时候我自己都要返回去看看参数意义，显得比较累赘。<br />
3. 变量的文本标签的计算方法不太好，有时得多次调解cex参数，比较麻烦，这个是个比较大的问题。<br />
4. 之前，准备多做做变量排序的事情，后来发现seriation包已经做得非常好了，其中一位作者Kurt还是R core之一，每次提交package时，几乎都是他把关。corrplot包的定位还是轻量级，在维数&lt;50的时候娱乐娱乐。</span></strong></span></p></blockquote>
<p>欢迎广大朋友批评指正。</p>
<script type="text/javascript" src="/wp-content/plugins/shjs-syntax-hiliter/shjs/lang/sh_slang.js"></script><h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2011/12/09 -- <a href="http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/" title="中小矩阵的可视化: corrplot 更新至 0.60">中小矩阵的可视化: corrplot 更新至 0.60</a> (5)</li><li>2011/10/22 -- <a href="http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/" title="秋雨梧桐叶落时: corrplot包0.40版本出炉">秋雨梧桐叶落时: corrplot包0.40版本出炉</a> (12)</li><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2010/05/10 -- <a href="http://taiyun.cos.name/2010/05/co-author-network-in-chinese-three-top-journal/" title="国内三大经济期刊合作作者关系网络及其可视化">国内三大经济期刊合作作者关系网络及其可视化</a> (19)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li><li>2009/08/23 -- <a href="http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/" title="距离矩阵可视化&#038;用TSP方法重排变量">距离矩阵可视化&#038;用TSP方法重排变量</a> (0)</li><li>2009/04/21 -- <a href="http://taiyun.cos.name/2009/04/squares-chart-of-correlation-matrix/" title="相关阵的方块图">相关阵的方块图</a> (0)</li><li>2009/03/25 -- <a href="http://taiyun.cos.name/2009/03/circles-chart-of-corrmatrix-to-wiqi-chart/" title="相关阵的圆圈图升级为围棋图">相关阵的圆圈图升级为围棋图</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2010/04/corrplot-0-20-came-out/feed/</wfw:commentRss>
		<slash:comments>20</slash:comments>
		</item>
		<item>
		<title>听丘成桐老师讲座之前中后</title>
		<link>http://taiyun.cos.name/2009/12/before-during-and-after-the-lecture-by-famous-mathematician-chengtong-qiu/</link>
		<comments>http://taiyun.cos.name/2009/12/before-during-and-after-the-lecture-by-famous-mathematician-chengtong-qiu/#comments</comments>
		<pubDate>Thu, 24 Dec 2009 10:23:40 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[概率统计]]></category>
		<category><![CDATA[lecture]]></category>
		<category><![CDATA[丘成桐]]></category>
		<category><![CDATA[后生可畏]]></category>
		<category><![CDATA[大师]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=527</guid>
		<description><![CDATA[昨晚跋山涉水，跑到湖南师范大学去听丘成桐老师的讲座(之后发现应该是座谈会)了。过程较为曲折，讲座时间很短，并且以问答为主，比较散漫，仅仅回答了7个问题；可惜的是多数问题都是内定了的，有专门负责提问的人；而且她们(果然是师大啊，很多师太)的很多问题并不是我所关心的:( 总体来说，本次座谈会给我印象较深的有三点：1. 合作交流很重要；2.要有好奇心和恒心；3.良好的文学修养，对培养做学问的气质很重要。下面记一个流水账以及讲座前后之花絮吧。 ## begin 流水账 1. 讲座 在一波又一波的全场起立和热烈掌声之中，丘老师大约在9点左右来到了现场，在师大领导郑重地介绍和赞美之后，丘老师开始了简短的讲话(大约10分钟吧)。在这10分钟内，丘老师重点谈的是“合作、交流”，是说思维的碰撞和摩擦才能激发出智慧的火花，并且在一个团队中，大家相互鼓励、相互扶持，即使失败了也不会非常沮丧；而一个人单枪匹地干，很有局限性。丘老师然后提了一下自己的合作朋友，并比较了中外在这方面的不同，其中一个明显的意思就是国内在这方面做得还不够，希望能够加以改善。 之后就开始了大家的互动环节，共回答了7个问题。其中第一个问题是问对于非天才的我们，如何在数学王国里纵横驰骋；丘老师如此回答基本上是这样的： 我不认为存在天才，我遇到了很多很聪明的数学家，他们在学术上非常厉害，但是我认为他们没有太出众的地方，并不能谈得上是天才；我在伯克利第一年上XX课程的时候，刚开始觉得同学们都很厉害，向老师的提问都很难，后来我才发现原来他们的问题基本都是扯淡。……因此，大家最需要的是兴趣和坚持…… 我的一点想法：天才显然不是天生的，但是经过后天的培养(尤其是20岁之前思维能力、想象能力的锻炼)，他们就变成了天才；这个很大程度上就是教育的原因了，20岁之前是培养思维、想象等能力的黄金岁月，而我们在这些能力上的欠缺导致我们很难望其项背。并且让天才回答“存在不存在天才，什么是天才”是个比较尴尬、可笑的事情，他们看问题的角度和我们不一样，丘老师、爱因斯坦等人都不承认天才，这和他们本身的层次是有关的。 第二个问题是问数学学者的生活问题以及如何树立价值观。丘老师说我们生活的时代很幸福，我没有看见哪一个优秀的数学家有任何经济上的困难，我们很高兴可以一方面做自己喜欢的事情，另一方面不用担心经济问题。其中还提到了十大吃香职业排行榜(第一，玩数学的；第二，搞精算的；第三，泡统计的)，还说学数学去路很广，大家不要担忧。 第三个问题是寻求丘老师对喜欢钻研数学的大学本科生有哪些建议。丘老师回答根据环境而定，不可一概而论。 第四个问题是奥数和数学人才的关系。丘老师说到了参加奥数同学的动机问题，并说在美国很多人是为了兴趣而参加，而中国则是为了利益、为了进名校而参加，并且国内参加奥数的大都是以考试为指挥棒，并没有真正广泛深入探究数学之美，而仅仅学习奥数常考得那些题目。所以不同的国度、不同的动机、不同的方式导致了奥数结果的不同。 第五个问题是问当今数学的主流。丘老师说没有明显的主流，但是数论在3000年以来一直是人们研究的重点。并鼓励大家自我创新，开辟出一个主流来。 第六个问题是问其他爱好(红楼梦等文学作品)和数学的关系以及丘老师如何教育孩子的。丘老师坦言文学作品的美好，并强调了他们对培养做学问的气质的重要性。谈到教育，丘老师提到自己在哈佛大学生物博士的孩子，说自己并不干涉孩子的兴趣爱好，其中尤其强调了好奇心的力量。 第七个问题是问我国的数学地位和我国有没有数学重镇。丘老回答的比较隐晦，说我国数学的地位曾经比较高，并有两次非常耀眼(没有具体展开)；再就是鼓励大家加把劲，争取建立世界瞩目的数学重镇。 然后，拍了张照，大约10点左右整个讲座就匆匆结束了(丘老师次日一早要乘飞机，需要早些休息)。 2. 讲座前后 讲座时间是晚上9-10点，而我是4点半出发，12点回来的，在此记载一下讲座前后的花花絮絮，其中关于学弟学妹的消息很令人振奋。 在等待讲座时，遇到了一位09级的大一小朋友——阮声帅，初次和他见面是在新老生交流会上；当时他问了一个问题，给我流下了深刻的印象：目前学到的各种数学学科都是散的，怎么建立一个有机的体系，搞清楚它们之间的关系并把他们放在一个框架内。这个问题很大，我当时没敢回答(也着实回答不了)，这次见了他冒昧推荐了克莱因的一系列数学科普读物，着重从数学史和数学哲学上来追本溯源。更令我惊讶的是，他现在已经大量阅读数学史、数学科普读物了，并广泛涉猎各个数学分支，包含数论、代数等。目前他还孜孜不倦地推导3、4次方程的公式解，并把一些成果发表在他们的学术QQ群中；此外，他还给我讲了一下为什么5次以上方程没有公式解(不过我没听很明白，惭愧啊。和他相比，我的大学生活真的很废，后生着实可畏~ 我们铁道杀到河西的一共7人，大二6个小朋友和我，回来的时候，已经没有公交了。我们先派海波同学率领三位MM打的回去，剩下韩帅、刘贯春和我三人，我突然发神经提议我们步行回去吧，没想到他们一致非常同意；于是我们就健步如飞，大踏步向铁道迈进。在寂寞的马路之上，在茫茫的烟雨之中，在昏黄的路灯之下，不知不觉两个小时的路程就被我们一步一步消灭了。我们一路谈了他们目前的学习状况、谈了统计学的出路等问题，非常畅快。在聊天之中，我还了解到很多振奋、惊讶的消息，比如统计交流协会的SAS group在汤耀华的带领下，生机勃勃，他们的一部分在一个多月的课余时间内就看完了几本SAS中、英文经典，目前好几人已经要准备SAS base的考试了，很赞他们的效率。再比如，他们班的某些同学都成学习狂了，不但在每天6点多起床早读，并且令人发指的是有些人竟然在学校自习室关灯后意犹未尽地跑到对面的中心医院中的空病房里上自习，一直到宿舍大门要关的时候才回来，这一直持续到病房里流感的人住满后他们无机可乘才再没去！ 回来路上，天落了小雨，我们一行三人觉得更是尽兴，但却苦了海波同学。他打的回来之后，发现下了小雨，就拿着几把伞跑到校门口准备迎接我们，而我们在路上谈得高兴，他的10来个电话我们都没接到，很温暖、很惭愧地让他在风雨之中苦苦等了我们那么长时间。提到风雨，突然想起主席的一首《浪淘沙》，气势磅礴，在此谨以此词祝福他们努力改造恶劣环境，打造属于自己的新天地： 大雨落幽燕，白浪滔天，秦皇岛外打鱼船。一片汪洋都不见，知向谁边。 往事越千年，魏武挥鞭，东临碣石有遗篇。萧瑟秋风今又是，换了人间。 本文中的照片是丘老师的弟子的弟子，也就是我院信科专业的蒋伟峰弟弟照的，再次印证社会网络的“小世界”之说。 去听讲的朋友很多很多，临时还换了会场，经历了很多波折。这里必须要赞扬的是湖师大的国防生朋友们，他们为维持秩序做了很多工作，并且个个都非常和蔼、非常有礼貌、素质很高:) ## end 流水账 随机日志2010/05/10 -- 国内三大经济期刊合作作者关系网络及其可视化 (19)2011/12/09 -- 中小矩阵的可视化: corrplot 更新至 0.60 (5)2008/07/09 -- 应用商务统计分析（王汉生 北京大学出版社） (1)2009/11/07 -- 亩产万斤&#038;所谓常识&#038;认识论 (5)2008/10/14 -- 《R软件与最优化》初稿已定 (2)2011/06/17 -- <a href='http://taiyun.cos.name/2009/12/before-during-and-after-the-lecture-by-famous-mathematician-chengtong-qiu/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>昨晚跋山涉水，跑到湖南师范大学去听丘成桐老师的讲座<span style="color: #008000;">(之后发现应该是座谈会)</span>了。过程较为曲折，讲座时间很短，并且以问答为主，比较散漫，仅仅回答了7个问题；可惜的是多数问题都是内定了的，有专门负责提问的人；而且她们<span style="color: #008000;">(果然是师大啊，很多师太)</span>的很多问题并不是我所关心的:(</p>
<p>总体来说，本次座谈会给我印象较深的有三点：<strong><span style="color: #0000ff;">1. 合作交流很重要；2.要有好奇心和恒心；3.良好的文学修养，对培养做学问的气质很重要。</span></strong>下面记一个流水账以及讲座前后之花絮吧。</p>
<p><span style="color: #008000;"><strong>## begin 流水账</strong></span></p>
<h2>1. 讲座</h2>
<p>在一波又一波的全场起立和热烈掌声之中，丘老师大约在9点左右来到了现场，在师大领导郑重地介绍和赞美之后，丘老师开始了简短的讲话<span style="color: #008000;">(大约10分钟吧)</span>。在这10分钟内，丘老师重点谈的是“合作、交流”，是说思维的碰撞和摩擦才能激发出智慧的火花，并且在一个团队中，大家相互鼓励、相互扶持，即使失败了也不会非常沮丧；而一个人单枪匹地干，很有局限性。丘老师然后提了一下自己的合作朋友，并比较了中外在这方面的不同，其中一个明显的意思就是国内在这方面做得还不够，希望能够加以改善。</p>
<p>之后就开始了大家的互动环节，共回答了7个问题。其中第一个问题是问对于非天才的我们，如何在数学王国里纵横驰骋；丘老师如此回答基本上是这样的：</p>
<blockquote><p>我不认为存在天才，我遇到了很多很聪明的数学家，他们在学术上非常厉害，但是我认为他们没有太出众的地方，并不能谈得上是天才；我在伯克利第一年上XX课程的时候，刚开始觉得同学们都很厉害，向老师的提问都很难，后来我才发现原来他们的问题基本都是扯淡。……因此，大家最需要的是兴趣和坚持……</p></blockquote>
<p>我的一点想法：天才显然不是天生的，但是经过后天的培养<span style="color: #008000;">(尤其是20岁之前思维能力、想象能力的锻炼)</span>，他们就变成了天才；这个很大程度上就是教育的原因了，20岁之前是培养思维、想象等能力的黄金岁月，而我们在这些能力上的欠缺导致我们很难望其项背。并且让天才回答“存在不存在天才，什么是天才”是个比较尴尬、可笑的事情，他们看问题的角度和我们不一样，<a href="http://www.jyb.cn/high/gjrw/200910/t20091023_318635.html" target="_blank">丘老师</a>、爱因斯坦等人都不承认天才，这和他们本身的层次是有关的。</p>
<p><a href="http://taiyun.cos.name/wp-content/uploads/2009/12/qiu.jpg"><img class="aligncenter size-full wp-image-529" title="丘成桐" src="http://taiyun.cos.name/wp-content/uploads/2009/12/qiu.jpg" alt="" width="480" height="360" /></a></p>
<p>第二个问题是问数学学者的生活问题以及如何树立价值观。丘老师说我们生活的时代很幸福，我没有看见哪一个优秀的数学家有任何经济上的困难，我们很高兴可以一方面做自己喜欢的事情，另一方面不用担心经济问题。其中还提到了<a href="http://www.careercast.com/jobs/content/JobsRated_10BestJobs">十大吃香职业排行榜</a><span style="color: #008000;">(第一，玩数学的；第二，搞精算的；第三，泡统计的)</span>，还说学数学去路很广，大家不要担忧。</p>
<p>第三个问题是寻求丘老师对喜欢钻研数学的大学本科生有哪些建议。丘老师回答根据环境而定，不可一概而论。</p>
<p>第四个问题是奥数和数学人才的关系。丘老师说到了参加奥数同学的动机问题，并说在美国很多人是为了兴趣而参加，而中国则是为了利益、为了进名校而参加，并且国内参加奥数的大都是以考试为指挥棒，并没有真正广泛深入探究数学之美，而仅仅学习奥数常考得那些题目。所以不同的国度、不同的动机、不同的方式导致了奥数结果的不同。</p>
<p>第五个问题是问当今数学的主流。丘老师说没有明显的主流，但是数论在3000年以来一直是人们研究的重点。并鼓励大家自我创新，开辟出一个主流来。</p>
<p>第六个问题是问其他爱好(红楼梦等文学作品)和数学的关系以及丘老师如何教育孩子的。丘老师坦言文学作品的美好，并强调了他们对培养做学问的气质的重要性。谈到教育，丘老师提到自己在哈佛大学生物博士的孩子，说自己并不干涉孩子的兴趣爱好，其中尤其强调了好奇心的力量。</p>
<p>第七个问题是问我国的数学地位和我国有没有数学重镇。丘老回答的比较隐晦，说我国数学的地位曾经比较高，并有两次非常耀眼(没有具体展开)；再就是鼓励大家加把劲，争取建立世界瞩目的数学重镇。</p>
<p>然后，拍了张照，大约10点左右整个讲座就匆匆结束了<span style="color: #008000;">(丘老师次日一早要乘飞机，需要早些休息)</span>。</p>
<h2>2. 讲座前后</h2>
<p>讲座时间是晚上9-10点，而我是4点半出发，12点回来的，在此记载一下讲座前后的花花絮絮，其中关于学弟学妹的消息很令人振奋。</p>
<ul>
<li>在等待讲座时，遇到了一位09级的大一小朋友——阮声帅，初次和他见面是在新老生交流会上；当时他问了一个问题，给我流下了深刻的印象：目前学到的各种数学学科都是散的，怎么建立一个有机的体系，搞清楚它们之间的关系并把他们放在一个框架内。这个问题很大，我当时没敢回答(也着实回答不了)，这次见了他冒昧推荐了克莱因的一系列数学科普读物，着重从数学史和数学哲学上来追本溯源。更令我惊讶的是，他现在已经大量阅读数学史、数学科普读物了，并广泛涉猎各个数学分支，包含数论、代数等。目前他还孜孜不倦地推导3、4次方程的公式解，并把一些成果发表在他们的学术QQ群中；此外，他还给我讲了一下为什么5次以上方程没有公式解(不过我没听很明白，惭愧啊。和他相比，我的大学生活真的很废，后生着实可畏~</li>
<li>我们铁道杀到河西的一共7人，大二6个小朋友和我，回来的时候，已经没有公交了。我们先派海波同学率领三位MM打的回去，剩下韩帅、刘贯春和我三人，我突然发神经提议我们步行回去吧，没想到他们一致非常同意；于是我们就健步如飞，大踏步向铁道迈进。在寂寞的马路之上，在茫茫的烟雨之中，在昏黄的路灯之下，不知不觉两个小时的路程就被我们一步一步消灭了。我们一路谈了他们目前的学习状况、谈了统计学的出路等问题，非常畅快。在聊天之中，我还了解到很多振奋、惊讶的消息，比如统计交流协会的SAS group在汤耀华的带领下，生机勃勃，他们的一部分在一个多月的课余时间内就看完了几本SAS中、英文经典，目前好几人已经要准备SAS base的考试了，很赞他们的效率。再比如，他们班的某些同学都成学习狂了，不但在每天6点多起床早读，并且令人发指的是有些人竟然在学校自习室关灯后意犹未尽地跑到对面的中心医院中的空病房里上自习，一直到宿舍大门要关的时候才回来，这一直持续到病房里流感的人住满后他们无机可乘才再没去！</li>
<li>回来路上，天落了小雨，我们一行三人觉得更是尽兴，但却苦了海波同学。他打的回来之后，发现下了小雨，就拿着几把伞跑到校门口准备迎接我们，而我们在路上谈得高兴，他的10来个电话我们都没接到，很温暖、很惭愧地让他在风雨之中苦苦等了我们那么长时间。提到风雨，突然想起主席的一首《浪淘沙》，气势磅礴，在此谨以此词祝福他们努力改造恶劣环境，打造属于自己的新天地：</li>
</ul>
<blockquote>
<p style="text-align: center;"><span style="color: #0000ff;"><strong> 大雨落幽燕，白浪滔天，秦皇岛外打鱼船。一片汪洋都不见，知向谁边。</strong></span></p>
<p style="text-align: center;"><span style="color: #0000ff;"><strong>往事越千年，魏武挥鞭，东临碣石有遗篇。萧瑟秋风今又是，换了人间。</strong></span></p>
</blockquote>
<ul>
<li>本文中的照片是丘老师的弟子的弟子，也就是我院信科专业的蒋伟峰弟弟照的，再次印证社会网络的“小世界”之说。</li>
<li>去听讲的朋友很多很多，临时还换了会场，经历了很多波折。这里必须要赞扬的是湖师大的国防生朋友们，他们为维持秩序做了很多工作，并且个个都非常和蔼、非常有礼貌、素质很高:)</li>
</ul>
<p><span style="color: #008000;"><strong>## end 流水账</strong></span></p>
<h3  class="related_post_title">随机日志</h3><ul class="related_post"><li>2009/12/17 -- <a href="http://taiyun.cos.name/2009/12/using-r-to-play-fractal-geometry/" title="用R来玩分形">用R来玩分形</a> (11)</li><li>2009/07/13 -- <a href="http://taiyun.cos.name/2009/07/the-road-not-taken/" title="未选择的路—罗伯特·弗罗斯特">未选择的路—罗伯特·弗罗斯特</a> (0)</li><li>2009/05/13 -- <a href="http://taiyun.cos.name/2009/05/r-and-regression/" title="R和回归肉的故事">R和回归肉的故事</a> (0)</li><li>2009/02/11 -- <a href="http://taiyun.cos.name/2009/02/comment-of-2009-mcm/" title="2009年MCM竞赛感言">2009年MCM竞赛感言</a> (0)</li><li>2011/07/04 -- <a href="http://taiyun.cos.name/2011/07/happy-birthday-professor-yan/" title="严老师生日快乐，淡定，给力以及治学">严老师生日快乐，淡定，给力以及治学</a> (2)</li><li>2008/06/13 -- <a href="http://taiyun.cos.name/2008/06/wisdom-words-in-statistics-and-truth/" title="STATISTICS AND TRUTH 中关于统计学的超级经典语录">STATISTICS AND TRUTH 中关于统计学的超级经典语录</a> (0)</li><li>2009/02/05 -- <a href="http://taiyun.cos.name/2009/02/r-sudoku-bug/" title="R的sudoku包有待改进">R的sudoku包有待改进</a> (1)</li><li>2008/06/15 -- <a href="http://taiyun.cos.name/2008/06/young-china/" title="少年中国说(节选)">少年中国说(节选)</a> (2)</li><li>2008/06/11 -- <a href="http://taiyun.cos.name/2008/06/impressions-of-statistical-pitfalls/" title="《统计陷阱》读后感">《统计陷阱》读后感</a> (0)</li><li>2009/04/21 -- <a href="http://taiyun.cos.name/2009/04/squares-chart-of-correlation-matrix/" title="相关阵的方块图">相关阵的方块图</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2009/12/before-during-and-after-the-lecture-by-famous-mathematician-chengtong-qiu/feed/</wfw:commentRss>
		<slash:comments>53</slash:comments>
		</item>
		<item>
		<title>用R来玩分形</title>
		<link>http://taiyun.cos.name/2009/12/using-r-to-play-fractal-geometry/</link>
		<comments>http://taiyun.cos.name/2009/12/using-r-to-play-fractal-geometry/#comments</comments>
		<pubDate>Thu, 17 Dec 2009 10:59:17 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[生活娱乐]]></category>
		<category><![CDATA[COS]]></category>
		<category><![CDATA[fractal]]></category>
		<category><![CDATA[koch]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=493</guid>
		<description><![CDATA[A fractal is “a rough or fragmented geometric shape that can be split into parts, each of which is (at least approximately) a reduced-size copy of the whole,”a property called self-similarity. Roots of mathematical interest in fractals can be traced back to the late 19th Century; however, the term “fractal” was coined by Benoît Mandelbrot <a href='http://taiyun.cos.name/2009/12/using-r-to-play-fractal-geometry/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<blockquote>
<p style="text-align: left;"><span style="color: #000080;">A fractal is “a rough or fragmented geometric shape that can be split into parts, each of which is (at least approximately) a reduced-size copy of the whole,”a property called self-similarity. Roots of mathematical interest in fractals can be traced back to the late 19th Century; however, the term “fractal” was coined by Benoît Mandelbrot in 1975 and was derived from the Latin fractus meaning “broken” or “fractured.” A mathematical fractal is based on an equation that undergoes iteration, a form of feedback based on recursion.</span></p>
<p style="text-align: right;">(form <a href="http://en.wikipedia.org/wiki/Fractal" target="_blank">Wikipedia</a>)</p>
</blockquote>
<p>分形几何是几何学中的新分支，其维数可以是任意值。分形图形的一个重要特点是自相似性，据此性质可以人工构造出很多养眼的图片，这里给出四种常见的分形图。更多代码和讨论请移步<a href="http://cos.name/bbs/read.php?tid=17644" target="_blank">COS论坛</a>。</p>
<h2>1. 树叶</h2>
<pre class="sh_slang">plot.leaf <- function(n=50000, col="green",cex=2){
  x <- c(.5, .5);
  plot(x[1], x[2], xlim=c(-3, 3), ylim =c(0, 10),type="n",xlab="",ylab="")
  p <- c( .85,  .92,  .99,  1.00);
  A <- rbind(c(.85, .04), c(-.04,.85), c(.20,-.26), c(.23,.22),
             c(-.15,.28), c(.26,.24),  c(0, 0), c(0, .16))
  B <- cbind(c(0, 1.6), c(0, 1.6), c(0,.44), c(0,0))

  for (i in 1:n){
     ran  <-  runif(1);
	 ind <- rank(c(p, ran), ties.method="min")[5]
	 x <- A[(2*ind-1):(2*ind),]%*%x + B[,ind]
    points(x[1],x[2], pch=".", cex=cex, col=col)
  }
}
#library(Cairo)
#CairoPNG()
par(mar=c(0,0,0,0)+0.1)
plot.leaf(cex=1.6)
box()
#dev.off()
</pre>
<p><img class="aligncenter size-full wp-image-492" title="koch" src="http://taiyun.cos.name/wp-content/uploads/2009/12/leaf0.png" alt="koch" width="480" height="480" /></p>
<h2>2. 树</h2>
<p><img class="aligncenter size-full wp-image-492" title="tree" src="http://taiyun.cos.name/wp-content/uploads/2009/12/tree.png" alt="koch" width="480" height="480" /></p>
<h2>3. 三角</h2>
<p><img class="aligncenter size-full wp-image-492" title="tri" src="http://taiyun.cos.name/wp-content/uploads/2009/12/tri.png" alt="koch" width="480" height="480" /></p>
<h2>4. 雪花</h2>
<p><img class="aligncenter size-full wp-image-492" title="koch" src="http://taiyun.cos.name/wp-content/uploads/2009/12/koch.png" alt="koch" width="480" height="480" /></pre>
</pre>
<script type="text/javascript" src="/wp-content/plugins/shjs-syntax-hiliter/shjs/lang/sh_slang.js"></script><h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2009/12/14 -- <a href="http://taiyun.cos.name/2009/12/all-about-the-2nd-r-conference/" title="第二届R会议那些事儿(上海)">第二届R会议那些事儿(上海)</a> (25)</li><li>2009/12/08 -- <a href="http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/" title="第二届R会议随想">第二届R会议随想</a> (47)</li><li>2011/12/09 -- <a href="http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/" title="中小矩阵的可视化: corrplot 更新至 0.60">中小矩阵的可视化: corrplot 更新至 0.60</a> (5)</li><li>2011/10/22 -- <a href="http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/" title="秋雨梧桐叶落时: corrplot包0.40版本出炉">秋雨梧桐叶落时: corrplot包0.40版本出炉</a> (12)</li><li>2011/05/03 -- <a href="http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/" title="第四届R会议, R与最优化">第四届R会议, R与最优化</a> (7)</li><li>2011/04/20 -- <a href="http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/" title="EBImage包以及学术模特Lena的八卦">EBImage包以及学术模特Lena的八卦</a> (4)</li><li>2011/04/13 -- <a href="http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/" title="周总理与小波分析 (小波分析连载系列之零)">周总理与小波分析 (小波分析连载系列之零)</a> (12)</li><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li><li>2009/08/23 -- <a href="http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/" title="距离矩阵可视化&#038;用TSP方法重排变量">距离矩阵可视化&#038;用TSP方法重排变量</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2009/12/using-r-to-play-fractal-geometry/feed/</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>第二届R会议那些事儿(上海)</title>
		<link>http://taiyun.cos.name/2009/12/all-about-the-2nd-r-conference/</link>
		<comments>http://taiyun.cos.name/2009/12/all-about-the-2nd-r-conference/#comments</comments>
		<pubDate>Mon, 14 Dec 2009 11:11:31 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[COS]]></category>
		<category><![CDATA[上海]]></category>
		<category><![CDATA[会议]]></category>
		<category><![CDATA[华东师大]]></category>
		<category><![CDATA[商业]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=474</guid>
		<description><![CDATA[公元2009年12月13日下午，第二届R会议上海分会场急匆匆地、意犹未尽地结束了，整个第二届R会议也终于完满地落下了帷幕。做为两会代表之一，我觉得有必要用我贫乏的文字来记载本届R会议的点点滴滴以及我自己的一些感触。上篇博文谈了很多北京会场的事儿，这里重点说说上海会场。 1. 辛勤、无私的会议组织者 首先必须感谢在幕后为会议默默奉献的工作人员，上海会场的主席是张翔和焦静两位热心人，先借用益辉的一段话吧： 张翔呢，我没想到他会担起这次会议组织者的角色，上海会场在他的带领下也办得有声有色（看看会议通知页面的宣传海报多么亮丽），和焦静两人拉赞助、发传单、安排吃住，作为已经工作的人，对一门自由软件如此费心，甚为难得；焦静呢，现在不在统计专业（生态），却帮忙做着一门统计软件的推广，跑校区、定会场、找领导，忙得不亦乐乎…… 会议组织人员还包括焦静姐姐实验室的一批朋友，她们是辛勤、无私的幕后英雄，有些甚至为会议熬出了黑眼圈，焦静姐姐的导师陈老师也为本次会议默默付出了很多，非常感谢他们为大家做出的贡献。 2. 演讲报告&#38;世界真小 首先要说的是国内LaTeX、R的传播方面的元老级人物——汤银才老师，汤老师兴致勃勃地全程参加了这次R会议，为大家做了《R与WinBUGS》的报告，在报告中还充分赞扬了COS论坛对R传播的不菲贡献。之前一直在CTEX上、《应用概率统计》上看见汤老师的大名，没想到竟然能和汤老师相逢在第二届R会议中，真是神奇。此外，汤老师还对我的娱乐工作(矩阵可视化)非常感兴趣，让我觉得受宠若惊。 我在演讲中反复提到了台湾中央研究院统计所的陈君厚老师，却没想到离我座位很近的一位大哥就曾在陈老师那里学习工作，并且他还是在人大读的博士！这位大哥叫林帧舜，来自台湾，目前在商界驰骋，还是吉林大学的兼职教授。林兄演讲非常幽默风趣，时常让全场沸腾。再插播一则令人兴奋的好消息：林兄告诉我以后的会议可以帮我们请陈老师等人过来(陈老师也是useR！)，期待中。此外，林兄有句经典的话“人大的学生就是喜欢折腾”，让我思绪万千。 据说(这个据说被证明是正确的)华人在美国统计界占了半壁江山，哥伦比亚大学的统计系系主任应志良就是其中出色的一位。应老师是彪悍的复旦数学系78级校友，这次会议中碰巧就见到了一位应老师的女弟子，数理功底很扎实、演讲水平很出色，非常仰慕。 东南大学的王卫杰老师也赶过来指导大家，王老师和我们一起吃烧饼、聊天，丝毫没有副教授的架子，很nice。 日程表上，思喆、李健师兄第二天早上是包场，但是后来又加进来几场报告，最后思喆、李健师兄的报告都是急匆匆的飞过去了，很可惜。 3. 眼光犀利的商业公司 我没有特意逛商场、街市，但仅仅从本次R会议相关的人物、演讲就感觉到了上海的商业氛围之浓厚。 12月11号刚到上海后，托cloudly的福气，去和一位传奇色彩浓厚的Mr. Liu吃饭。Mr. Liu在一家很famous的大公司工作，是一位成熟的商业人士，他竟然是通过阅读文献—— 知道R——关注R Journal—— 发现国内第一届R会议的通讯——找到COS——得知第二次R会议消息的。在饭桌上，Mr. Liu谈笑风生，提到了很多顶级大牛、paper，让我觉得很汗颜。这年头越来越多的商业公司开始关注R了，看来R的确在商界、工业界产生了较大的影响，R的舞台也不只是学术界了。 Mongo solutions是本次R会议上海分会场的赞助商，这次有幸见识了中国区负责人Mr. Shao，发现Mr. Shao竟然如此年轻，真是英雄出少年啊。同样，Mongo solutions非常重视R，他们甚至为辉瑞公司开发过基于R的产品(我之前一直认为辉瑞的世界里只有SAS)。值得一提的是，他们在全球范围内赞助R会议，支持R的发展，最终达到学术圈和产业圈的双赢，这一点值得广大国内公司学习。目前他们还在招聘R数据分析师呢，有兴趣的朋友可以去尝试一下。 中芯国际集成电路制造（上海）有限公司是国内R的资深用户之一，他们充分发挥R的特性，使得很多分析工作轻松便捷。通过去年刘明大哥以及今年林光启经理的演讲，我不禁感叹“R就是生产力啊”。此外，还有很多朋友在台上台下谈到了R在企业界的各种应用，非常热闹。 倚天不出，谁与争锋？免费、绿色、强大的R肯定会得到越来越多商业公司的青睐。在以后的R会议中，希望得到越来越多商业公司的支持赞助，推动R在国内的发展，达到学界、企业界双赢、多赢的局面。 4. 无知者无畏的我们 好事者、无知者无畏，这是我对我们团队(我和三位学弟)的评价，本次会议中很多演讲者都是高校博士、教授以及企业中的佼佼者，而我们目前只有个高中文凭，却怀着一腔热血四处招摇，实在是无知者无畏。不过在招摇的过程中，我们的确丰富了知识、开拓了视野、碰撞了思想，也愈觉得自己是井底之蛙，因此也愈有改变现状的动力和方向。会议结束了，以后的重点就是吸取会议精神，扬长补短，奋勇前进了。 5. 两会之区别 最后扯一下个人眼中两会之区别，否则对不住“两会代表”的称号。 上海会场是较为严谨的会议室，貌似还有全程录像，再加上一批教授、博导、博士、国外朋友的莅临，气氛显得非常正式；而北京会场则自由很多。此外，上海会场中的商业氛围较浓，谈到了很多商业应用；而北京则更学术。最后要说的是，上海会场很爆满，门外面都站着人遥遥偷窥，而北京会场比较稀疏(当然两个会场的大小不一样)。 最后期待下一届R会议更精彩，也祝愿各位R user越来越强大。 相关文章2009/12/08 -- 第二届R会议随想 (47)2009/12/17 -- 用R来玩分形 (11)2011/12/09 -- 中小矩阵的可视化: corrplot 更新至 0.60 (5)2011/10/22 -- 秋雨梧桐叶落时: corrplot包0.40版本出炉 <a href='http://taiyun.cos.name/2009/12/all-about-the-2nd-r-conference/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>公元2009年12月13日下午，第二届R会议上海分会场急匆匆地、意犹未尽地结束了，整个第二届R会议也终于完满地落下了帷幕。做为两会代表之一，我觉得有必要用我贫乏的文字来记载本届R会议的点点滴滴以及我自己的一些感触。<a href="http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/">上篇博文</a>谈了很多北京会场的事儿，这里重点说说上海会场。</p>
<h2><strong><span style="color: #000080;">1. 辛勤、无私的会议组织者</span></strong></h2>
<p>首先必须感谢在幕后为会议默默奉献的工作人员，上海会场的主席是张翔和焦静两位热心人，先借用<a href="http://yihui.name/cn/2009/12/snow-in-ames-and-2nd-chinese-r-conference/" target="_blank">益辉的一段话</a>吧：</p>
<blockquote><p><span style="color: #800000;"><strong>张翔呢，我没想到他会担起这次会议组织者的角色，上海会场在他的带领下也办得有声有色（看看<a href="http://cos.name/user/user-2009/" target="_blank">会议通知页面</a>的宣传海报多么亮丽），和焦静两人拉赞助、发传单、安排吃住，作为已经工作的人，对一门自由软件如此费心，甚为难得；焦静呢，现在不在统计专业（生态），却帮忙做着一门统计软件的推广，跑校区、定会场、找领导，忙得不亦乐乎…… </strong></span></p></blockquote>
<p>会议组织人员还包括焦静姐姐实验室的一批朋友，她们是辛勤、无私的幕后英雄，有些甚至为会议熬出了黑眼圈，焦静姐姐的导师陈老师也为本次会议默默付出了很多，非常感谢他们为大家做出的贡献。</p>
<h2><strong><span style="color: #000080;">2. 演讲报告&amp;世界真小</span></strong></h2>
<p>首先要说的是国内LaTeX、R的传播方面的元老级人物——汤银才老师，汤老师兴致勃勃地全程参加了这次R会议，为大家做了《R与WinBUGS》的报告，在报告中还充分赞扬了COS论坛对R传播的不菲贡献。之前一直在CTEX上、《应用概率统计》上看见汤老师的大名，没想到竟然能和汤老师相逢在第二届R会议中，真是神奇。此外，汤老师还对我的娱乐工作(矩阵可视化)非常感兴趣，让我觉得受宠若惊。</p>
<p>我在演讲中反复提到了台湾中央研究院统计所的陈君厚老师，却没想到离我座位很近的一位大哥就曾在陈老师那里学习工作，并且他还是在人大读的博士！这位大哥叫林帧舜，来自台湾，目前在商界驰骋，还是吉林大学的兼职教授。林兄演讲非常幽默风趣，时常让全场沸腾。再插播一则令人兴奋的好消息：林兄告诉我以后的会议可以帮我们请陈老师等人过来(陈老师也是useR！)，期待中。此外，林兄有句经典的话“人大的学生就是喜欢折腾”，让我思绪万千。</p>
<p>据说<span style="color: #808080;">(这个据说被证明是正确的)</span>华人在美国统计界占了半壁江山，哥伦比亚大学的统计系系主任应志良就是其中出色的一位。应老师是彪悍的<a href="http://www.yadian.cc/blog/37238/" target="_blank">复旦数学系78级校友</a>，这次会议中碰巧就见到了一位应老师的女弟子，数理功底很扎实、演讲水平很出色，非常仰慕。</p>
<p>东南大学的王卫杰老师也赶过来指导大家，王老师和我们一起吃烧饼、聊天，丝毫没有副教授的架子，很nice。</p>
<p>日程表上，思喆、李健师兄第二天早上是包场，但是后来又加进来几场报告，最后思喆、李健师兄的报告都是急匆匆的飞过去了，很可惜。</p>
<h2><strong><span style="color: #000080;">3. 眼光犀利的商业公司</span></strong></h2>
<p>我没有特意逛商场、街市，但仅仅从本次R会议相关的人物、演讲就感觉到了上海的商业氛围之浓厚。</p>
<p>12月11号刚到上海后，托<a href="http://www.loyhome.cn" target="_blank">cloudly</a>的福气，去和一位传奇色彩浓厚的Mr. Liu吃饭。Mr. Liu在一家很famous的大公司工作，是一位成熟的商业人士，他竟然是通过阅读文献——<span style="color: #000080;"> </span> 知道R——关注R Journal—— 发现国内第一届R会议的通讯——找到COS——得知第二次R会议消息的。在饭桌上，Mr. Liu谈笑风生，提到了很多顶级大牛、paper，让我觉得很汗颜。这年头越来越多的商业公司开始关注R了，看来R的确在商界、工业界产生了较大的影响，R的舞台也不只是学术界了。</p>
<p>Mongo solutions是本次R会议上海分会场的赞助商，这次有幸见识了中国区负责人Mr. Shao，发现Mr. Shao竟然如此年轻，真是英雄出少年啊。同样，Mongo solutions非常重视R，他们甚至为辉瑞公司开发过基于R的产品(我之前一直认为辉瑞的世界里只有SAS)。值得一提的是，他们在全球范围内赞助R会议，支持R的发展，最终达到学术圈和产业圈的双赢，这一点值得广大国内公司学习。目前他们还在<a href="http://jobs.chinahr.com/html/2009-12/10/50911250002128000003.htm" target="_blank">招聘R数据分析师</a>呢，有兴趣的朋友可以去尝试一下。</p>
<p>中芯国际集成电路制造（上海）有限公司是国内R的资深用户之一，他们充分发挥R的特性，使得很多分析工作轻松便捷。通过去年刘明大哥以及今年林光启经理的演讲，我不禁感叹“R就是生产力啊”。此外，还有很多朋友在台上台下谈到了R在企业界的各种应用，非常热闹。</p>
<p>倚天不出，谁与争锋？免费、绿色、强大的R肯定会得到越来越多商业公司的青睐。在以后的R会议中，希望得到越来越多商业公司的支持赞助，推动R在国内的发展，达到学界、企业界双赢、多赢的局面。</p>
<h2><span style="color: #000080;"><strong>4. 无知者无畏的我们</strong></span></h2>
<p>好事者、无知者无畏，这是我对我们团队(我和三位学弟)的评价，本次会议中很多演讲者都是高校博士、教授以及企业中的佼佼者，而我们目前只有个高中文凭，却怀着一腔热血四处招摇，实在是无知者无畏。不过在招摇的过程中，我们的确丰富了知识、开拓了视野、碰撞了思想，也愈觉得自己是井底之蛙，因此也愈有改变现状的动力和方向。会议结束了，以后的重点就是吸取会议精神，扬长补短，奋勇前进了。</p>
<h2><strong><span style="color: #000080;">5. 两会之区别</span></strong></h2>
<p>最后扯一下个人眼中两会之区别，否则对不住“两会代表”的称号。</p>
<p>上海会场是较为严谨的会议室，貌似还有全程录像，再加上一批教授、博导、博士、国外朋友的莅临，气氛显得非常正式；而北京会场则自由很多。此外，上海会场中的商业氛围较浓，谈到了很多商业应用；而北京则更学术。最后要说的是，上海会场很爆满，门外面都站着人遥遥偷窥，而北京会场比较稀疏(当然两个会场的大小不一样)。</p>
<p>最后期待下一届R会议更精彩，也祝愿各位R user越来越强大。</p>
<h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2009/12/08 -- <a href="http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/" title="第二届R会议随想">第二届R会议随想</a> (47)</li><li>2009/12/17 -- <a href="http://taiyun.cos.name/2009/12/using-r-to-play-fractal-geometry/" title="用R来玩分形">用R来玩分形</a> (11)</li><li>2011/12/09 -- <a href="http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/" title="中小矩阵的可视化: corrplot 更新至 0.60">中小矩阵的可视化: corrplot 更新至 0.60</a> (5)</li><li>2011/10/22 -- <a href="http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/" title="秋雨梧桐叶落时: corrplot包0.40版本出炉">秋雨梧桐叶落时: corrplot包0.40版本出炉</a> (12)</li><li>2011/05/03 -- <a href="http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/" title="第四届R会议, R与最优化">第四届R会议, R与最优化</a> (7)</li><li>2011/04/20 -- <a href="http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/" title="EBImage包以及学术模特Lena的八卦">EBImage包以及学术模特Lena的八卦</a> (4)</li><li>2011/04/13 -- <a href="http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/" title="周总理与小波分析 (小波分析连载系列之零)">周总理与小波分析 (小波分析连载系列之零)</a> (12)</li><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li><li>2009/08/23 -- <a href="http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/" title="距离矩阵可视化&#038;用TSP方法重排变量">距离矩阵可视化&#038;用TSP方法重排变量</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2009/12/all-about-the-2nd-r-conference/feed/</wfw:commentRss>
		<slash:comments>25</slash:comments>
		</item>
		<item>
		<title>第二届R会议随想</title>
		<link>http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/</link>
		<comments>http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/#comments</comments>
		<pubDate>Mon, 07 Dec 2009 22:21:49 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[生活娱乐]]></category>
		<category><![CDATA[COS]]></category>
		<category><![CDATA[会议]]></category>
		<category><![CDATA[感激]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=440</guid>
		<description><![CDATA[来去匆匆，期待已久的第二届R语言中国会议北京会场落下帷幕了；欢乐趣，离别苦，尽管非常留恋不舍，但诚如范兄在会议结束时感慨，天下无不散之筵席。紧急撤离之时，感动失落之余，谨记长路漫漫，在以后的日子里还需多多努力，不负众兄弟姐妹的殷切期望。先贴一个会议留影吧： 感激，高兴，欣慰，惊诧，羡慕，惭愧，失落，抱歉？此时此刻我不知怎么来准确地表达。但可以肯定的是，感动+感激+感恩+感谢+感慨这几个词一直萦绕在我的世界中。在回来时拥挤的车厢内，我也分别问了三个学弟收获了什么，他们的回答非常一致：首先是感动，社区的温暖让大家感慨不已；第二才是具体性的技术，很长见识，也让大家认识到了自己的狭隘和不足。我一直认为，人生在世，情感是最最首要的，事业是第二的，两者也有相当程度的交互影响。在一个和谐、温馨的社区中，大家相互学习、交流合作、心心相印、肝胆相照本身不仅是一种财富，同时也能使大家相互学习、取长补短、共同进步，这或许就是“共产主义精神”的最好诠释吧。 1. 故事、人物篇 在之前在会议准备阶段，张兄、焦姐、关姐、邱兄、范兄、陈兄、蒋兄等会议组织者以及远在海外的谢兄都给了我们很大的支持、鼓励和帮助。考虑到准备时间仓促、甲流等原因，今年的R会议本来打算京沪两地都是小规模的，仅仅一天。而我们这边一下就是四个人报名，而且都是两会代表（人大会场+华师会场）加预备演讲，这么浩浩荡荡、兴师动众的，给会议安排制造了很大的麻烦。的确，R会议一年就这么一次，机会如此宝贵，而我们4个人厚着脸皮霸占这么多资源，本身就很过意不去，加之我们才疏学浅，能给大家带来的演讲价值有限，因此我们一直有种罪恶感，也曾经想着为了会议日程主动退出一个会场。但是遭到了邱兄、蒋兄、谢兄、潘兄等人的反对和鼓励，大家如此的支持让我们非常感动、非常惭愧。 在去人大之前，给亲爱的张老师发了邮件，张老师非常热情，还亲切地约我聊天吃饭。去了之后，在明德楼找到了他，聊了很长时间，谈到了学习、生活、网络等诸多方面。老师让我根据兴趣爱好自主选择方向，非常自由，并且说可以联系全国该方向的老师来请教。之后，老师又开车带我吃饭，在饭桌上，叮嘱我多多吃肉。我当天中午在火车上没有吃什么东西，因此谨遵教诲，在饭桌上非常放肆，饕肉餮菜，筷子一直没闲着。吃完之后老师又送我回了人大，让我感慨不已。我也时常扪心自问，我何德何能，蒙此殊遇啊。 4号晚上，我们到了人大统计学院机房，和邱兄、范兄、关姐、陈兄及一位非常可爱的人大师弟一起高兴地装了会议胸卡和资料袋，还戮力干掉了菁菁姐姐的一包很sweet的小橘子，期间大家还以会议横幅为背景拍了一些珍贵的照片。说到这里，想起第一届会议时候在10楼的应用统计研究中心装胸牌、资料的时候了，那时买的胸牌很难装，纸很软，胸牌套的口子很小，装一个很费劲。悉潭等人还在房间内拍照留影，我自己面像凶恶，一般不敢糟蹋相机和景观，就在谢兄的电脑上查了查邮件，瞻仰了一下谢兄一大架子的打印书稿。眨眼间，一年就这么过去了，人来人去、花落花开啊~ 回到住处明德楼招待所之后，已经很晚了，见了阔别一年的悉潭兄弟，心里又默默感慨了一番；也给正复习考研的郑冰同学发了短信致以慰问。李程、高涛两位师弟第二天是首场讲座，压力很大，我们紧急排演了一遍，对原来的slides进行了适当地修改。等我睡得时候是两点多了，两位学弟熬到了三点多才睡。在此，向两位可爱的学弟表示钦佩和祝福，回想起此前的准备阶段，我时常比较苛责，给了他们很多压力甚至批评；而他们以博大的胸襟宽容了我的种种不好，始终没有记恨我，令我羞愧感激不已。作为学长我应该更加宽容才是，这方面他们比我做得好很多很多。 在明德楼招待所中，有种宾至如归的感觉，并不是这个招待所有多么nice，实际上这家招待所价格比较昂贵(150 per day)、服务比较一般，相同条件的在长沙最多就40元，让我真正觉得温馨的是在这里发生的故事。我是第三次去这家旅店了，第一次是参加第一届R会议，是在谢兄的鼓励下、陈钢师兄的带领下第一次杀到北京，学会了怎么坐地铁，陈钢师兄还带我去了教育部一趟。记得当时迎接我们的是余浩宇师兄，很周到、很温馨。在明德楼招待所中，我们和郑冰、詹鹏、悉潭等人开玩笑，逗乐子，玩得不亦乐乎。第二天晚上，陈钢师兄住同学那了，刚好丁国徽大哥从欧洲赶了过来，晚上我们就住在一起，还看了一小会电视，是关于《西游记》的拍摄历程的记录片，丁大哥很喜欢笑，很nice，很懂得享受生活，他给我展示了欧洲的货币，还送给我三枚硬币留作纪念，在当晚的宴席上，还不断为我倒啤酒。第二天，丁大哥耐心地听了我just-so-so的演讲，还让我把那个用环游全国省会城市的TSP路线图发给他，他说要拿那个去旅游，顿时让我觉得很温馨很有成就感。上午会场结束之后，丁大哥就匆匆地扛着行李离开了。下午会场刚一结束，我和陈钢师兄也匆匆离开了，刚好赶上火车。两年都是这样，匆匆而来，匆匆而去，沉淀下来的是感动和伴随感动的一份伤感。 第二次来这个招待所是保研面试时候，那时在人大统计机房查阅了附件的宾馆，敲定了这家，然后潘兄就送我过去，走的不是平常那条要穿越立交桥的小路，因为邱兄特地叮嘱了，平时那条不是正路、不安全。潘兄回去之后，我就温馨地独守空房。在人大面试的时候，邱兄、潘兄、李兄、蒋兄、左兄、王兄、范兄、陈兄、方姐等都给了我很大的鼓励支持，我想请大家吃顿饭的权利都被残酷而温馨地剥夺了。实际上，我的保研之路比较曲折，能来人大我都感到很惊奇。我是在厦大面试时候突然决定提前退场临时买机票来北京的，两地的面试的时间是冲突的，这个突然决定的原因有很多，包括COS长期以来对我的支持，包括邱兄、陈兄、谢兄的温暖协助和建议意见，尤其是和邱兄之前的聊天和通话，从某种程度来看，这个”突然决定“是偶然的，也是必然的。但我在人大的表现并不是很好，我觉得成功的概率并不大。我也在想，如果我被人大拒了，可能就去上财、华师等学校中的一所(当时貌似很盲目自信)。但是小概率事件发生了，或许这就是缘分吧。 在修改slides之时，打开我的mp3，赫然发现去年会议的资料还在里面，同样的会议、同样的旅店、同样的mp3、两份时隔一年的材料……，我顿时百感交集。我的mp3很少听，几乎没用过，去年还是拿着它去开会的，并且在插到连接投影仪的电脑的时候，发现有病毒，谢兄还让我回去杀杀我电脑上的毒；其实，我一直认为我的电脑比较绿色，我怀疑是插了陈钢师兄的电脑感染的，呵呵。 去年今日此门中，人面桃花相映红。人面不知何处去，桃花依旧笑春风。陈钢师兄、国徽大哥、谢兄、吴老师都飘扬过海，去追求人生的价值和梦想了。今年的会议由邱兄、范兄、陈兄等人掌舵，同样精彩，而以后的会议谁来主持？。 说到这里，必须要感谢低调、温馨、强大、奉献、细心、体贴、善良的邱兄和范兄等人了，是你们的付出让大家在温馨感动之时享受学术的趣味，目前我对此只能表示感动+感激+感恩+感谢+感慨，尽管都是苍白的。还有，这次原本打算好好会一会人大的各位好兄弟们，但是发现时间安排太紧了，闲暇时间太少，当然还有自身懒惰等原因，没有向广大nice, sweet 的兄弟们一一致敬，非常抱歉。 最后写给和我一起杀到北京的三位学弟以及所有中南大学统计交流协会的师弟师妹们，在大学四年的生活中，我已经是夕阳西下，而你们是旭日东升。在大学期间，我没有探索到多少真理，没有学到太多的知识，虚度了很多光影，我有的仅仅是在寻寻觅觅、磕磕碰碰之中的经验和教训；我深知环境的恶劣，也亲眼目睹一批又一批人在这里彷徨最终堕落。或许是受谢兄、COS等的影响，我希望能搭建一个平台，让大家相互勉励，共同进步。也就是我们协会的口号：“做平台，做气氛；促交流。促进步”。作为一名好事者，我自己深切体会到自己力量之绵薄，心有余而力不足，我自身的局限性很大，现在来看，平台也并没有搭建得多好，对你们或许起不到太大的帮助作用。目前我知道你们08级的学习气氛很浓厚，我已经非常欣慰了。 对中南大学统计交流协会R group的几位朋友们，我要再次感谢你们的宽容、努力和进步，你们在很多方面比我优秀很多很多，希望你们再接再砺，继续披荆斩棘、奋勇前进。我是个比较感性的人，很多方面不够理智，对你们没有做到像邱兄、思喆大哥那样慈祥、体贴、耐心，说话也很直，不怎么委婉。而你们一直对我非常信赖+支持，让我非常感动而又惭愧。沉舟侧畔千帆过，病树前头万木春，你们的未来一定光辉无比。我给你们每人都送了一本书，大体涵盖以下几个层面：哲学+历史+数学或统计，这个其实代表了我对学习教育的某种观点，希望你们不要仅仅死抓课本，适当探究学科哲学和学科历史是有必要的，而这个在国内是完全被忽视的。或许我是个喜欢空谈思想的人，但在实干之余还是希望你们稍稍注意一下。 2. 演讲、报告篇 5号6号两天的报告一共19篇。 (1) 开幕词、R的基础知识(陈堰平) 陈兄是本次会议的主席，在找工作的忙碌之中担此重任实属不易，并且我来人大读数理，就是被陈兄“撺掇”的；在演讲中，陈兄提到了R会议在国内的挖井人——谢兄，并抓出了谢兄的靓照，比较之后得出了他二人非常神似的结论。这让我想起了面试时候，几位老师说我也比较像谢兄，但得知我是甘肃人之后立马改口说不像，让我哭笑不得。而据陈兄说，我和谢兄后脑勺比较像，这个嘛，可能人的后脑勺都差不多…… (2) 统计图形概览及其在R下的实现(高涛和李程) 这是两位08级学弟的演讲题目，他们的幻灯片将近90页，准备了很长时间，主要参考了谢兄的《现代统计图形》，Statistics with R，R graph Gallery，Michael Friendly 的统计图片网页等很多材料。他们大一时候是数学大类方向，这个学期才接触统计知识，在准备的过程中往往觉得统计知识比较欠缺，为了充分理解图的含义，他们自主往前学习了很多后续的统计知识，熬了好多个通宵。尽管最终的演讲有几处理论错误，但是总体来说相当精彩，我从中也学到了很多东西。李程学弟怕时间不够，一路往过飞；而高涛不缓不急，娓娓道来，让做师兄的我松了一口气的同时很是汗颜。不过要批评的是他们最后忙中出错，把统计学院说成了数理统计学院，呵呵。 (3) RExcel应用数据挖掘方法现代发展趋势(关菁菁) 之前知道菁菁姐姐(忘了问到底是姐姐还是妹妹，姑且以姐姐称呼)是本次会议北京会务组的R core之一， 这次有幸得见真人版，很是荣幸。菁菁姐姐不仅幽默风趣、温柔大方，而且理论扎实、演讲很有条理，她提到了很多数据挖掘中的算法和方法，很多都是我之前没听过的，包括集成算法Ensemble Learning等，这个让我再次意识到了学校之间、个人之见的巨大差距。刘兄在会议闭幕时说，巾帼不让须眉，诚如此，汗颜中…… (4) R在食品标准研制中的应用与展望(钟其顶) 其实很早就在谢兄的博客中听过钟老师的大名了，这次有幸一见并能聆听教诲，很是高兴。民以食为天，钟老师谈到了统计学在食品中的应用，尤其说到了酒类判别分类问题。大家听了都非常馋，都想尝尝92年的陈酿是啥个滋味；不过肖楠师弟说葡萄酿酒太糟蹋了，葡萄要比葡萄酒好很多:) 钟老师还提到了统计数据问题，比较了食品行业和经济金融行业的数据质量，让场内玩数据的人感慨万千；的确，数据质量是统计的第一关，如果数据本身有问题，那后面的工作都是白费力气了，正所谓“垃圾进，垃圾出”。必须要说的是，钟老师相当和蔼可亲，还邀请我明年去他那里做客，非常感动。可惜的是，为了保证必要的记忆力我还不能大量喝酒，要不这一年一定好好锻炼酒量，争取到时喝他个天昏地暗(这个念头有点猥琐啊)。 (5) R环境安全特性初探与前瞻(肖楠) 学弟的作品，灵感来源于cos英文论坛上谢兄和颜兄的一个帖子，以此为源，小楠同学花了很长时间，深入研究了一下R的很多底层函数，在不同系统级web R中测试了R代码的潜在威胁，得到了一些很有意思的结论，很多听众都对学弟的演讲很感兴趣，so nice. 我也非常钦佩他的探索精神。这位肖学弟是典型的夜猫子，在这学期中时常五六点才睡觉(都是准备paper、slides、blog、课程学习等，倒没有不务正业)，让我觉得很害怕、很担心，我也曾多次叮嘱他别睡那么晚(我是一两点)。身体是革命的本钱，在此我想以这句话同时告诫我们两人，希望我们以后能有一个良好的作息时间安排。 (6) Integrate R into <a href='http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>来去匆匆，期待已久的<a href="http://cos.name/useR/useR-2009/" target="_blank">第二届R语言中国会议</a>北京会场落下帷幕了；欢乐趣，离别苦，尽管非常留恋不舍，但诚如范兄在会议结束时感慨，天下无不散之筵席。紧急撤离之时，感动失落之余，谨记长路漫漫，在以后的日子里还需多多努力，不负众兄弟姐妹的殷切期望。先贴一个会议留影吧：<br />
<a href="http://taiyun.cos.name/wp-content/uploads/2009/12/2nd-r-meeting2.jpg"><img class="aligncenter size-large wp-image-441" title="第二届R中国会议留影，点击看大图" src="http://taiyun.cos.name/wp-content/uploads/2009/12/2nd-r-meeting2-1024x470.jpg" alt="2nd-r-meeting2" width="500" height="230" /></a><br />
感激，高兴，欣慰，惊诧，羡慕，惭愧，失落，抱歉？此时此刻我不知怎么来准确地表达。但可以肯定的是，<strong><span style="color:#000080;">感动+感激+感恩+感谢+感慨</span></strong>这几个词一直萦绕在我的世界中。在回来时拥挤的车厢内，我也分别问了三个学弟收获了什么，他们的回答非常一致：首先是感动，社区的温暖让大家感慨不已；第二才是具体性的技术，很长见识，也让大家认识到了自己的狭隘和不足。我一直认为，人生在世，情感是最最首要的，事业是第二的，两者也有相当程度的交互影响。在一个和谐、温馨的社区中，大家相互学习、交流合作、心心相印、肝胆相照本身不仅是一种财富，同时也能使大家相互学习、取长补短、共同进步，这或许就是“共产主义精神”的最好诠释吧。</p>
<h2><span style="color: #000080;">1. 故事、人物篇</span></h2>
<p>在之前在会议准备阶段，<a href="http://www.simplemining.com/wp/" target="_blank">张兄</a>、焦姐、关姐、<a href="http://yixuan.cos.name/cn/" target="_blank">邱兄</a>、范兄、陈兄、蒋兄等会议组织者以及远在海外的<a href="http://yihui.name/" target="_blank">谢兄</a>都给了我们很大的支持、鼓励和帮助。考虑到准备时间仓促、甲流等原因，今年的R会议本来打算京沪两地都是小规模的，仅仅一天。而我们这边一下就是四个人报名，而且都是两会代表（人大会场+华师会场）加预备演讲，这么浩浩荡荡、兴师动众的，给会议安排制造了很大的麻烦。的确，R会议一年就这么一次，机会如此宝贵，而我们4个人厚着脸皮霸占这么多资源，本身就很过意不去，加之我们才疏学浅，能给大家带来的演讲价值有限，因此我们一直有种罪恶感，也曾经想着为了会议日程主动退出一个会场。但是遭到了邱兄、蒋兄、谢兄、潘兄等人的反对和鼓励，大家如此的支持让我们非常感动、非常惭愧。</p>
<p>在去人大之前，给亲爱的张老师发了邮件，张老师非常热情，还亲切地约我聊天吃饭。去了之后，在明德楼找到了他，聊了很长时间，谈到了学习、生活、网络等诸多方面。老师让我根据兴趣爱好自主选择方向，非常自由，并且说可以联系全国该方向的老师来请教。之后，老师又开车带我吃饭，在饭桌上，叮嘱我多多吃肉。我当天中午在火车上没有吃什么东西，因此谨遵教诲，在饭桌上非常放肆，饕肉餮菜，筷子一直没闲着。吃完之后老师又送我回了人大，让我感慨不已。我也时常扪心自问，我何德何能，蒙此殊遇啊。</p>
<p>4号晚上，我们到了人大统计学院机房，和邱兄、范兄、关姐、陈兄及一位非常可爱的人大师弟一起高兴地装了会议胸卡和资料袋，还戮力干掉了菁菁姐姐的一包很sweet的小橘子，期间大家还以会议横幅为背景拍了一些珍贵的照片。说到这里，想起第一届会议时候在10楼的应用统计研究中心装胸牌、资料的时候了，那时买的胸牌很难装，纸很软，胸牌套的口子很小，装一个很费劲。悉潭等人还在房间内拍照留影，我自己面像凶恶，一般不敢糟蹋相机和景观，就在谢兄的电脑上查了查邮件，瞻仰了一下谢兄一大架子的打印书稿。眨眼间，一年就这么过去了，人来人去、花落花开啊~</p>
<p>回到住处明德楼招待所之后，已经很晚了，见了阔别一年的悉潭兄弟，心里又默默感慨了一番；也给正复习考研的郑冰同学发了短信致以慰问。李程、高涛两位师弟第二天是首场讲座，压力很大，我们紧急排演了一遍，对原来的slides进行了适当地修改。等我睡得时候是两点多了，两位学弟熬到了三点多才睡。在此，向两位可爱的学弟表示钦佩和祝福，回想起此前的准备阶段，我时常比较苛责，给了他们很多压力甚至批评；而他们以博大的胸襟宽容了我的种种不好，始终没有记恨我，令我羞愧感激不已。作为学长我应该更加宽容才是，这方面他们比我做得好很多很多。</p>
<p>在明德楼招待所中，有种宾至如归的感觉，并不是这个招待所有多么nice，实际上这家招待所价格比较昂贵(150 per day)、服务比较一般，相同条件的在长沙最多就40元，让我真正觉得温馨的是在这里发生的故事。我是第三次去这家旅店了，第一次是参加第一届R会议，是在谢兄的鼓励下、陈钢师兄的带领下第一次杀到北京，学会了怎么坐地铁，陈钢师兄还带我去了教育部一趟。记得当时迎接我们的是余浩宇师兄，很周到、很温馨。在明德楼招待所中，我们和郑冰、詹鹏、悉潭等人开玩笑，逗乐子，玩得不亦乐乎。第二天晚上，陈钢师兄住同学那了，刚好丁国徽大哥从欧洲赶了过来，晚上我们就住在一起，还看了一小会电视，是关于《西游记》的拍摄历程的记录片，丁大哥很喜欢笑，很nice，很懂得享受生活，他给我展示了欧洲的货币，还送给我三枚硬币留作纪念，在当晚的宴席上，还不断为我倒啤酒。第二天，丁大哥耐心地听了我just-so-so的演讲，还让我把那个用环游全国省会城市的TSP路线图发给他，他说要拿那个去旅游，顿时让我觉得很温馨很有成就感。上午会场结束之后，丁大哥就匆匆地扛着行李离开了。下午会场刚一结束，我和陈钢师兄也匆匆离开了，刚好赶上火车。两年都是这样，匆匆而来，匆匆而去，沉淀下来的是感动和伴随感动的一份伤感。</p>
<p>第二次来这个招待所是保研面试时候，那时在人大统计机房查阅了附件的宾馆，敲定了这家，然后潘兄就送我过去，走的不是平常那条要穿越立交桥的小路，因为邱兄特地叮嘱了，平时那条不是正路、不安全。潘兄回去之后，我就温馨地独守空房。在人大面试的时候，邱兄、潘兄、李兄、蒋兄、左兄、王兄、范兄、陈兄、方姐等都给了我很大的鼓励支持，我想请大家吃顿饭的权利都被残酷而温馨地剥夺了。实际上，我的保研之路比较曲折，能来人大我都感到很惊奇。我是在厦大面试时候突然决定提前退场临时买机票来北京的，两地的面试的时间是冲突的，这个突然决定的原因有很多，包括COS长期以来对我的支持，包括邱兄、陈兄、谢兄的温暖协助和建议意见，尤其是和邱兄之前的聊天和通话，从某种程度来看，这个”突然决定“是偶然的，也是必然的。但我在人大的表现并不是很好，我觉得成功的概率并不大。我也在想，如果我被人大拒了，可能就去上财、华师等学校中的一所(当时貌似很盲目自信)。但是小概率事件发生了，或许这就是缘分吧。</p>
<p>在修改slides之时，打开我的mp3，赫然发现去年会议的资料还在里面，同样的会议、同样的旅店、同样的mp3、两份时隔一年的材料……，我顿时百感交集。我的mp3很少听，几乎没用过，去年还是拿着它去开会的，并且在插到连接投影仪的电脑的时候，发现有病毒，谢兄还让我回去杀杀我电脑上的毒；其实，我一直认为我的电脑比较绿色，我怀疑是插了陈钢师兄的电脑感染的，呵呵。</p>
<p>去年今日此门中，人面桃花相映红。人面不知何处去，桃花依旧笑春风。陈钢师兄、国徽大哥、谢兄、吴老师都飘扬过海，去追求人生的价值和梦想了。今年的会议由邱兄、范兄、陈兄等人掌舵，同样精彩，而以后的会议谁来主持？。</p>
<p>说到这里，必须要感谢低调、温馨、强大、奉献、细心、体贴、善良的邱兄和范兄等人了，是你们的付出让大家在温馨感动之时享受学术的趣味，目前我对此只能表示感动+感激+感恩+感谢+感慨，尽管都是苍白的。还有，这次原本打算好好会一会人大的各位好兄弟们，但是发现时间安排太紧了，闲暇时间太少，当然还有自身懒惰等原因，没有向广大nice, sweet 的兄弟们一一致敬，非常抱歉。</p>
<p>最后写给和我一起杀到北京的三位学弟以及所有中南大学统计交流协会的师弟师妹们，在大学四年的生活中，我已经是夕阳西下，而你们是旭日东升。在大学期间，我没有探索到多少真理，没有学到太多的知识，虚度了很多光影，我有的仅仅是在寻寻觅觅、磕磕碰碰之中的经验和教训；我深知环境的恶劣，也亲眼目睹一批又一批人在这里彷徨最终堕落。或许是受谢兄、COS等的影响，我希望能搭建一个平台，让大家相互勉励，共同进步。也就是我们协会的口号：“做平台，做气氛；促交流。促进步”。作为一名好事者，我自己深切体会到自己力量之绵薄，心有余而力不足，我自身的局限性很大，现在来看，平台也并没有搭建得多好，对你们或许起不到太大的帮助作用。目前我知道你们08级的学习气氛很浓厚，我已经非常欣慰了。</p>
<p>对中南大学统计交流协会R group的几位朋友们，我要再次感谢你们的宽容、努力和进步，你们在很多方面比我优秀很多很多，希望你们再接再砺，继续披荆斩棘、奋勇前进。我是个比较感性的人，很多方面不够理智，对你们没有做到像邱兄、思喆大哥那样慈祥、体贴、耐心，说话也很直，不怎么委婉。而你们一直对我非常信赖+支持，让我非常感动而又惭愧。沉舟侧畔千帆过，病树前头万木春，你们的未来一定光辉无比。我给你们每人都送了一本书，大体涵盖以下几个层面：哲学+历史+数学或统计，这个其实代表了我对学习教育的某种观点，希望你们不要仅仅死抓课本，适当探究学科哲学和学科历史是有必要的，而这个在国内是完全被忽视的。或许我是个喜欢空谈思想的人，但在实干之余还是希望你们稍稍注意一下。</p>
<h2><span style="color: #000080;">2. 演讲、报告篇</span></h2>
<p>5号6号两天的报告一共19篇。</p>
<h3><span style="color: #000080;">(1) 开幕词、R的基础知识(陈堰平)</span></h3>
<p>陈兄是本次会议的主席，在找工作的忙碌之中担此重任实属不易，并且我来人大读数理，就是被陈兄“撺掇”的；在演讲中，陈兄提到了R会议在国内的挖井人——谢兄，并抓出了谢兄的靓照，比较之后得出了他二人非常神似的结论。这让我想起了面试时候，几位老师说我也比较像谢兄，但得知我是甘肃人之后立马改口说不像，让我哭笑不得。而据陈兄说，我和谢兄后脑勺比较像，这个嘛，可能人的后脑勺都差不多……</p>
<h3><span style="color: #000080;">(2) 统计图形概览及其在R下的实现(高涛和李程)</span></h3>
<p>这是两位08级学弟的演讲题目，他们的幻灯片将近90页，准备了很长时间，主要参考了谢兄的《现代统计图形》，Statistics with R，R graph Gallery，Michael Friendly 的统计图片网页等很多材料。他们大一时候是数学大类方向，这个学期才接触统计知识，在准备的过程中往往觉得统计知识比较欠缺，为了充分理解图的含义，他们自主往前学习了很多后续的统计知识，熬了好多个通宵。尽管最终的演讲有几处理论错误，但是总体来说相当精彩，我从中也学到了很多东西。李程学弟怕时间不够，一路往过飞；而高涛不缓不急，娓娓道来，让做师兄的我松了一口气的同时很是汗颜。不过要批评的是他们最后忙中出错，把统计学院说成了数理统计学院，呵呵。</p>
<h3><span style="color: #000080;">(3) RExcel应用数据挖掘方法现代发展趋势(关菁菁)</span></h3>
<p>之前知道菁菁姐姐(忘了问到底是姐姐还是妹妹，姑且以姐姐称呼)是本次会议北京会务组的R core之一， 这次有幸得见真人版，很是荣幸。菁菁姐姐不仅幽默风趣、温柔大方，而且理论扎实、演讲很有条理，她提到了很多数据挖掘中的算法和方法，很多都是我之前没听过的，包括集成算法Ensemble Learning等，这个让我再次意识到了学校之间、个人之见的巨大差距。刘兄在会议闭幕时说，巾帼不让须眉，诚如此，汗颜中……</p>
<h3><span style="color: #000080;">(4) R在食品标准研制中的应用与展望(钟其顶)</span></h3>
<p>其实很早就在谢兄的博客中听过钟老师的大名了，这次有幸一见并能聆听教诲，很是高兴。民以食为天，钟老师谈到了统计学在食品中的应用，尤其说到了酒类判别分类问题。大家听了都非常馋，都想尝尝92年的陈酿是啥个滋味；不过肖楠师弟说葡萄酿酒太糟蹋了，葡萄要比葡萄酒好很多:)   钟老师还提到了统计数据问题，比较了食品行业和经济金融行业的数据质量，让场内玩数据的人感慨万千；的确，数据质量是统计的第一关，如果数据本身有问题，那后面的工作都是白费力气了，正所谓“垃圾进，垃圾出”。必须要说的是，钟老师相当和蔼可亲，还邀请我明年去他那里做客，非常感动。可惜的是，为了保证必要的记忆力我还不能大量喝酒，要不这一年一定好好锻炼酒量，争取到时喝他个天昏地暗(这个念头有点猥琐啊)。</p>
<h3><span style="color: #000080;">(5) R环境安全特性初探与前瞻(肖楠)</span></h3>
<p>学弟的作品，灵感来源于cos英文论坛上<a href="http://cos.name/en/topic/shut-down-your-windows-with-r" target="_blank">谢兄和颜兄的一个帖子</a>，以此为源，<a href="http://road2stat.com/" target="_blank">小楠同学</a>花了很长时间，深入研究了一下R的很多底层函数，在不同系统级web R中测试了R代码的潜在威胁，得到了一些很有意思的结论，很多听众都对学弟的演讲很感兴趣，so nice. 我也非常钦佩他的探索精神。这位肖学弟是典型的夜猫子，在这学期中时常五六点才睡觉(都是准备paper、slides、blog、课程学习等，倒没有不务正业)，让我觉得很害怕、很担心，我也曾多次叮嘱他别睡那么晚(我是一两点)。身体是革命的本钱，在此我想以这句话同时告诫我们两人，希望我们以后能有一个良好的作息时间安排。</p>
<h3><span style="color: #000080;">(6) Integrate R into Your C/C++ Application (宫雨)</span></h3>
<p>宫雨老师的演讲相当有技术含量，他花了大量时间阅读了大量R的底层代码(Read the fucking code)，指出了R底层之处的很多不足，并实现了由C/C++调用R的基本方法。其完美主义精神给人流下了深刻印象，同时也鞭策我们做事不要浅尝辄止。</p>
<h3><span style="color: #000080;">(7) 地质环境调查监测研究中的R应用(刘永生)</span></h3>
<p>刘老师是R的资深用户，据说是2001年(或2003年)就开始使用R，在工作中积累了大批函数，给我们分享了用R分析地质领域数据的优势所在，还和google地图结合在了一起，很好很强大！他说他们研究所以后招学生必须会R才要，语气、态度非常坚决！刘老师也是资深COS潜水员，这次能来会场为大家传经实在是我们的荣幸。</p>
<h3><span style="color: #000080;">(8) R在灰色系统理论方面的应用(奚潭)</span></h3>
<p>悉兄是唯一一位在去年、今年都和我住在明德楼招待所的哥们，这让多愁善感的我顿时感慨万千。桃花依旧笑春风，悉兄讲了国产的灰色理论在R中的实现，并打算写一个package，在此表示鼓励。悉兄问道有没有cran关于灰色理论的package，我觉得应该没有，这东西是国产的，并且走的路子和标准的统计方法不一样，模糊数学界的人关注多一点，统计学界的貌似很少。去上海时候，悉兄还要给我们带盐水鸭，好期望、好感动……</p>
<h3><span style="color: #000080;">(9) R在大规模数据整理及自动化报告方面的应用(刘思喆)</span></h3>
<p>时光白驹过隙，<a href="http://www.bjt.name/" target="_blank">刘兄</a>慈祥依旧，学弟戏称刘兄是加宽版的周总理。COS论坛R版版主、《153分钟学会R》的作者、长期为大家默默奉献R知识的刘兄的讲座给我印象很深，之前我并没有意识到自动化报告方面的重要意义，因为我做得东西都是一次性的，不需要太多重复，后来一次重复性很强的项目中才意识到这个问题的重要性。</p>
<h3><span style="color: #000080;">(10) R在市场研究中的应用(祝迎春)</span></h3>
<p>祝先生用统计软件近10年，接触了各种各样的统计软件，并且还把R和SPSS结合在了一起，为不喜欢coding的同志们提供了很大的便捷(不过也损失了很多优美的东西)，大家对他的演讲都很诧异+惊叹。不过他在演讲中说R对他来说就是黑匣子，这个我(以及很多人)差点跳起来，我不知道他说的白匣子指什么。此外，祝先生的slides中还提到了我在COS论坛中提到的对smart visualization的一点看法，他说这个已经是实现了的，不过就他演示的例子来看，这个实现还处于社会主义初级之初级阶段，和我意识中的smart vis有很大差距。</p>
<h3><span style="color: #000080;">(11) R心理学笔记(孙晓燕)</span></h3>
<p>孙学姐从深圳赶来，实属不易，并且孙学姐决定演讲的小部分原因是受到了我的煽动和蛊惑，对此先得意一把，我也想当“统计人贩子”。孙学姐是<a href="http://lixiaoxu.lxxm.com/" target="_blank">李晓煦</a>老师的弟子，正在出国准备中，百忙之中远道而来为大家展示R在心理学方面的应用真的很难得。</p>
<h3><span style="color: #000080;">(12)  非参数方法与稳健性估计初探(左辰)</span></h3>
<p>左兄依然很理论，先羡慕一下，今年左兄讲得东西我听懂了一小部分，觉得比较欣慰。去年左兄讲的是分位数回归，他排在我前面，当时貌似他们几个(以及丁兄、陈兄)超时很多，我的实际演讲开始时刻比我的理论上演讲结束时刻都要靠后。结果我就只有10min的时间，不过我的东西很easy，9分钟就完毕了，还剩一分钟回答了一个问题。今年我也希望左兄多讲一会，我肚子里面墨水少，也准备像去年一样快速结束战斗。不过今年左兄的时间安排很准，没有超一点时，小小失望一把。</p>
<h3><span style="color: #000080;">(13) 矩阵可视化及 corrplot 包的介绍(魏太云)</span></h3>
<p>都不好意思说我自己的演讲了，前面是左辰，后面是陈丽云，他们都讲得很精彩，而我讲得很没有逻辑、层次，我夹在中间很汗颜、尴尬。之后问了学弟，他们也说没有我平时和我们讲得好，惭愧惭愧。不过我的东西比较晃人眼球，40张slide，差不多40张图，看起来还比较炫，大家都没打瞌睡，北大的一位赵兄说这是他第一次听课，我觉得非常欣慰满足了。</p>
<h3><span style="color: #000080;">(14) 在经济和计量中使用R (陈丽云)</span></h3>
<p>惊艳全场，这个是我们对<a href="http://www.loyhome.cn/">丽云</a>演讲最综合的评价，丽云一直谦虚自己讲得不好，但大家的眼睛是雪亮的，她演讲的内容很有思想、很有见地，并且会场把握能力很好，用范兄的话说就是“一看就知道是老手”。丽云侃侃而谈，提到了经济学和统计学的误区、结合点等很多大家关注的东西，这个对于两个学科的发展都是很重要的。此外，丽云还在午休时间抽空给我安了Lyx，并大致讲解了其基本用法，之前也给我的blog提了一些建议，并回答了中南大学统计交流协会对经济学的很多问题，长达万字之多，让我们非常非常那个。大家还戏称我们是2nd R 会议的两朵乌云(名字里面都有个云字，并且都是灰黑衣服)，这个和物理学中的两朵乌云是对应的，呵呵，荣幸一把先。</p>
<h3><span style="color: #000080;">(15) R在近红外光谱分析中的应用(孙蝶)</span></h3>
<p>又一个精彩的应用案例，提到了主成分分析、岭回归、Lasso、偏最小二乘法等，这个和菁菁姐姐、钟老师的演讲有相似之处，貌似Lasso、偏最小二乘异常火爆，可惜我不大懂，只能亡羊补牢啦。</p>
<h3><span style="color: #000080;">(16) R在空间分析中的应用初探(王化儒)</span></h3>
<p><a href="http://ecology.bnu.edu.cn/gejp/student/whr/index.htm" target="_blank">王兄</a>可是老朋友了，去年就和我们一道参加了R首届会议。这次王兄讲的是空间分析，还拉出来我的一张TSP漫游中国最短路线图，虽然是借此批判，我还是觉得非常荣幸。空间分析有很宽广的舞台，丽云就给我指出了经济学中很多需要空间分析的地方，我们数模之时，也时常碰见这种问题，只是用得很肤浅而已。再一次感慨统计舞台之广阔，也感慨统计和实际碰撞才会产生火花。</p>
<h3><span style="color: #000080;">(17) 应用omd包对QSAR分析中分子结构参数矩阵的优化(马斌)</span></h3>
<p>马兄也是老朋友了，马兄谈的是化学计量中的QSAR，我们学校化学院有人也在做QASR，我去忽悠过R，不过对QSAR一无所知。马兄在台上感慨说：眼睛一闭，会议就结束了；的确，这么好的交流机会真的太珍贵了，时间也很短，我和马兄都深知机会的宝贵性。</p>
<h3><span style="color: #000080;">(18) R与WinBUGS(丁鹏)</span></h3>
<p>也是老朋友，丁兄是北大耿直老师门下的高才生，长得十分秀气俊朗，天庭饱满，地阁方圆，印堂发亮，面带红光，天生贵族气质。丁兄不仅双扣、拱猪等纸牌游戏玩得烂熟，对统计方面的见解也比我深刻很多很多，以后去了北京一定多多请教他，呵呵。丁兄的题目是R与WinBUGS，这个和上海那边汤老师的题目是一致的。很惭愧，我目前对贝叶斯理论知之甚少，丁兄的演讲也听懂的不多，但大致的方向似乎了解到了。</p>
<h3><span style="color: #000080;">(19) WebR-R 在线分析及在大气数据分析中的应用(黄志一)</span></h3>
<p>一直以为黄志一应该是个gentleman，结果却是中科院计算所的一位靓丽姐姐，之前对他们的<a href="http://159.226.3.31:8080/WebR/ronline.html" target="_blank">WebR系统</a>一直很关注，也很看好，cos论坛上我也<a href="http://cos.name/bbs/read.php?tid=17074" target="_blank">发过贴提过</a>，大家对这个都很有兴趣。她们莅临会场来指导工作，我们也觉得很奇妙、很幸运(真不知他们是怎么得到R 会议这个消息的，难道他们也是灌水专业户？)。这个演讲是压轴好戏，大家提问是最多的。在计算量大的时候，我们自己的PC机很难满足，这时需要有个大型服务器来做这个工作，但是可惜的是我们自己时常得不到这个资源，而他们开发的Web-R就是很好的工作。先透漏一个好消息，该系统对中科院内部免费，中科院的同学们高兴去吧，同时也等着帮我往服务器上扔程序啊。</p>
<h2>3. 展望篇</h2>
<p>感慨万千，上面扯了很多，写了整个通宵，很乱很没条理，写到最后自己不知说了些什么，大家见谅。</p>
<p>最后期待下周的上海会场和以后的会议更加精彩成功，希望统计学在国内的发展更上一层楼。</p>
<p><strong><span style="color: #003300;">太云于己丑年潇湘夜雨之夜</span></strong></p>
<p><span style="color: #ff0000;">注：尽管貌似写了很多，但还是意犹未尽；很多精彩、感动的故事都没有写进去，也还有很多很多需要感谢的人没有一一提到；等下周上海会场之后再发感慨吧。</span></p>
<h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2009/12/14 -- <a href="http://taiyun.cos.name/2009/12/all-about-the-2nd-r-conference/" title="第二届R会议那些事儿(上海)">第二届R会议那些事儿(上海)</a> (25)</li><li>2009/12/17 -- <a href="http://taiyun.cos.name/2009/12/using-r-to-play-fractal-geometry/" title="用R来玩分形">用R来玩分形</a> (11)</li><li>2011/12/09 -- <a href="http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/" title="中小矩阵的可视化: corrplot 更新至 0.60">中小矩阵的可视化: corrplot 更新至 0.60</a> (5)</li><li>2011/10/22 -- <a href="http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/" title="秋雨梧桐叶落时: corrplot包0.40版本出炉">秋雨梧桐叶落时: corrplot包0.40版本出炉</a> (12)</li><li>2011/05/03 -- <a href="http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/" title="第四届R会议, R与最优化">第四届R会议, R与最优化</a> (7)</li><li>2011/04/20 -- <a href="http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/" title="EBImage包以及学术模特Lena的八卦">EBImage包以及学术模特Lena的八卦</a> (4)</li><li>2011/04/13 -- <a href="http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/" title="周总理与小波分析 (小波分析连载系列之零)">周总理与小波分析 (小波分析连载系列之零)</a> (12)</li><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li><li>2009/08/23 -- <a href="http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/" title="距离矩阵可视化&#038;用TSP方法重排变量">距离矩阵可视化&#038;用TSP方法重排变量</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/feed/</wfw:commentRss>
		<slash:comments>47</slash:comments>
		</item>
		<item>
		<title>浅谈Buffon投针问题及其推广</title>
		<link>http://taiyun.cos.name/2009/11/abrief-talk-on-buffon-throwing-needle-problems/</link>
		<comments>http://taiyun.cos.name/2009/11/abrief-talk-on-buffon-throwing-needle-problems/#comments</comments>
		<pubDate>Fri, 13 Nov 2009 08:50:29 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[概率统计]]></category>
		<category><![CDATA[buffon]]></category>
		<category><![CDATA[直观思维]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=403</guid>
		<description><![CDATA[## 注：此文也放在了cos主站上，这里顺便比较一下两个站点的阅读效果，评论请到cos主站上。 公元1777年，法国科学家D·布丰(D.Buffon 1707～1788)设计了一个巧夺天工的实验：往间距为a的平行线族之间投掷长为L 的针，可以计算出针和平行线相交的概率为： 根据此式，可以得到pi的近似估计值，这的确是一个伟大的、奇妙而划时代的实验，可算是蒙特卡罗模拟中的鼻祖和经典了。在大多数教材上，这个概率都是用积分或二重积分计算得来的，比较繁琐，在matrix67的博客中，我欣慰而惊奇地看到了一种非常简便、直观的解法，感慨了一番，也稍微思考了一番。 期望值的一个最引人注目的性质就是，E(A+B)=E(A)+E(B)，不管A和B是不是独立的。想象一根长度为L的铁丝，不管它被弯成了什么形状，扔到地上后它与地板上的平行线的交点个数的期望值都是一样的，并且这个值是和L成正比的。这是因为，我们可以把一根弯铁丝看作很多很多小的直线段构成；而每个充分小的直线段与平行线交点个数的期望都是相同的，那么由期望值的线性关系，整个弯铁丝与平行线交点数的期望就是c·L，其中c是某个固定的系数。为了求出这个系数是多少，我们只需要考虑一些特殊的情况。注意到，把一根长度为pi的铁丝弯成一个直径为1的圆，则把它扔到地上之后，它与这组平行线总有两个交点。这就是说，pi的c倍就等于2，即c等于2/pi。自然，一根单位长度的针与平行线的交点个数的期望值就是2/pi；而由于这根针与平行线要么没有交点，要么就只有一个交点，因此这个数值就相当于是针与平行线相交的概率了。——matrix67 matrix67是北大中文系的学生，他对数学思维的把握令我十分汗颜。期望的这条性质大家知道，但是离灵活运用却差得很远。根据上述理论，很容易得到，对于任何曲线，它和平行线族交点个数(Y)的期望都是： 其中S是该曲线周长。 如果要向平行线族之间投掷凸n边形（或者扩展到凸域，凸域就是过该图形任一点做切线，那么所有的点都在切线的同侧，也就是没有凹进去的部分），如果这个凸域的直径不大于平行线距离a的话，那么它和平行线族相交的概率为： 其中，S为凸区域的周长。 概率值刚好是交点个数期望的一半，这个也很直观，因为凸域和平行线的交点个数只有三种可能： 1个交点：当凸域和平行线相切，或者顶点重合 2个交点：这种情况是最常见的 无穷多个交点：有一边重合的时候 其中，第一种情况和第三种情况的几何概率为零，故概率值刚好是交点个数期望的一半(这里不太严谨，望大家指教)。把两根针并在一起，既可以构造一个闭区域，其与平行线相交的概率和交点个数都和上面理论一致。 如果投掷一般闭合区域的话，那么它和平行线族相交的概率依然为： 不过，此时S为该闭区域所生成的最小凸区域的周长。 因为尽管它们的周长不一样，和平行线交点的期望不一样，但是它们和平行线是否有交点的概率是一样的。下图中的类半圆图形就是月牙图形生成的最小凸区域，它们显然和平行线是否相交完全等价。 最后，要说的是直观思维的重要性，定理有千千万万，如果能用直观的形式将它们逐渐消化，那是最好不过的了，我在看书的时候经常能把一个定理啃下来，但是还是觉得对这个定理依然云里雾里的。对此，matrix67做了很精彩的评价： 数学学习真正悲哀的就是，记住了某个神奇而伟大的定理，看懂了其最严密的推导过程，但却始终没能直观地去理解它。虽然严密的推导是必要的，直观理解往往是不准确的，但如果能悟出一个让定理一瞬间变得很显然的解释，这不但是一件很酷的事，而且对定理更透彻的理解和更熟练的运用也很有帮助。 随机日志2009/04/21 -- 庄生逍遥游 (0)2008/07/09 -- 应用商务统计分析（王汉生 北京大学出版社） (1)2011/04/20 -- EBImage包以及学术模特Lena的八卦 (4)2009/02/11 -- 2009年MCM竞赛感言 (0)2009/12/17 -- 用R来玩分形 (11)2009/03/22 -- 用R写了个数字拼图的游戏 (0)2009/05/11 -- 《娄景书》预测2009年是涝灾之年 (0)2008/06/11 -- 《统计陷阱》读后感 (0)2009/05/13 -- R和回归肉的故事 (0)2009/04/28 -- 四张机，鸳鸯织就欲双飞。可怜未老头先白。春波碧草，晓寒深处，相对浴红衣 (0)]]></description>
			<content:encoded><![CDATA[<p><strong><span style="color: #008000;">## 注：此文也放在了<a href="http://cos.name/2009/11/a-brief-talk-on-buffon-throwing-needle-problems/">cos主站</a>上，这里顺便比较一下两个站点的阅读效果，评论请到<a href="http://cos.name/2009/11/a-brief-talk-on-buffon-throwing-needle-problems/">cos主站</a>上。</span></strong><br />
公元1777年，法国科学家D·布丰(D.Buffon 1707～1788)设计了一个巧夺天工的实验：往间距为a的平行线族之间投掷长为L 的针，可以计算出针和平行线相交的概率为：<br />
<img class="aligncenter size-full wp-image-420" title="pi_2ltopia" src="http://taiyun.cos.name/wp-content/uploads/2009/11/pi_2ltopia.png" alt="pi_2ltopia" width="85" height="46" /><br />
根据此式，可以得到pi的近似估计值，这的确是一个伟大的、奇妙而划时代的实验，可算是蒙特卡罗模拟中的鼻祖和经典了。在大多数教材上，这个概率都是用积分或二重积分计算得来的，比较繁琐，在<a href="http://www.matrix67.com/blog/archives/2494">matrix67的博客</a>中，我欣慰而惊奇地看到了一种非常简便、直观的解法，感慨了一番，也稍微思考了一番。</p>
<blockquote><p><strong><span style="color: #0000ff;">期望值的一个最引人注目的性质就是，E(A+B)=E(A)+E(B)，不管A和B是不是独立的。想象一根长度为L的铁丝，不管它被弯成了什么形状，扔到地上后它与地板上的平行线的交点个数的期望值都是一样的，并且这个值是和L成正比的。这是因为，我们可以把一根弯铁丝看作很多很多小的直线段构成；而每个充分小的直线段与平行线交点个数的期望都是相同的，那么由期望值的线性关系，整个弯铁丝与平行线交点数的期望就是c·L，其中c是某个固定的系数。为了求出这个系数是多少，我们只需要考虑一些特殊的情况。注意到，把一根长度为pi的铁丝弯成一个直径为1的圆，则把它扔到地上之后，它与这组平行线总有两个交点。这就是说，pi的c倍就等于2，即c等于2/pi。自然，一根单位长度的针与平行线的交点个数的期望值就是2/pi；而由于这根针与平行线要么没有交点，要么就只有一个交点，因此这个数值就相当于是针与平行线相交的概率了。——matrix67</span></strong></p></blockquote>
<p>matrix67是北大中文系的学生，他对数学思维的把握令我十分汗颜。期望的这条性质大家知道，但是离灵活运用却差得很远。根据上述理论，很容易得到，对于任何曲线，它和平行线族交点个数(Y)的期望都是：<br />
<img class="aligncenter size-full wp-image-422" title="pi_2stopia" src="http://taiyun.cos.name/wp-content/uploads/2009/11/pi_2stopia.png" alt="pi_2stopia" width="117" height="49" /></p>
<p>其中S是该曲线周长。</p>
<p>如果要向平行线族之间投掷凸n边形（或者扩展到凸域，凸域就是过该图形任一点做切线，那么所有的点都在切线的同侧，也就是没有凹进去的部分），如果这个凸域的直径不大于平行线距离a的话，那么它和平行线族相交的概率为：</p>
<p><img class="aligncenter size-full wp-image-423" title="P_stopia" src="http://taiyun.cos.name/wp-content/uploads/2009/11/P_stopia.png" alt="P_stopia" width="90" height="52" /></p>
<p>其中，S为凸区域的周长。<br />
概率值刚好是交点个数期望的一半，这个也很直观，因为凸域和平行线的交点个数只有三种可能：</p>
<ol>
<li>1个交点：当凸域和平行线相切，或者顶点重合</li>
<li>2个交点：这种情况是最常见的</li>
<li>无穷多个交点：有一边重合的时候</li>
</ol>
<p>其中，第一种情况和第三种情况的几何概率为零，故概率值刚好是交点个数期望的一半(这里不太严谨，望大家指教)。把两根针并在一起，既可以构造一个闭区域，其与平行线相交的概率和交点个数都和上面理论一致。</p>
<p>如果投掷一般闭合区域的话，那么它和平行线族相交的概率依然为：</p>
<p><img class="aligncenter size-full wp-image-423" title="P_stopia" src="http://taiyun.cos.name/wp-content/uploads/2009/11/P_stopia.png" alt="P_stopia" width="90" height="52" /></p>
<p>不过，此时S为该闭区域所生成的最小凸区域的周长。</p>
<p>因为尽管它们的周长不一样，和平行线交点的期望不一样，但是它们和平行线是否有交点的概率是一样的。下图中的类半圆图形就是月牙图形生成的最小凸区域，它们显然和平行线是否相交完全等价。</p>
<p><img class="aligncenter size-full wp-image-426" title="semicircle2" src="http://taiyun.cos.name/wp-content/uploads/2009/11/semicircle2.bmp" alt="semicircle2" /></p>
<p>最后，要说的是直观思维的重要性，定理有千千万万，如果能用直观的形式将它们逐渐消化，那是最好不过的了，我在看书的时候经常能把一个定理啃下来，但是还是觉得对这个定理依然云里雾里的。对此，<a href="http://www.matrix67.com/blog/archives/2494">matrix67</a>做了很精彩的评价：</p>
<blockquote><p><strong><span style="color: #0000ff;">数学学习真正悲哀的就是，记住了某个神奇而伟大的定理，看懂了其最严密的推导过程，但却始终没能直观地去理解它。虽然严密的推导是必要的，直观理解往往是不准确的，但如果能悟出一个让定理一瞬间变得很显然的解释，这不但是一件很酷的事，而且对定理更透彻的理解和更熟练的运用也很有帮助。</span></strong></p></blockquote>
<h3  class="related_post_title">随机日志</h3><ul class="related_post"><li>2009/05/13 -- <a href="http://taiyun.cos.name/2009/05/r-and-regression/" title="R和回归肉的故事">R和回归肉的故事</a> (0)</li><li>2009/04/21 -- <a href="http://taiyun.cos.name/2009/04/encourage-learning/" title="再读《劝学》">再读《劝学》</a> (2)</li><li>2009/12/08 -- <a href="http://taiyun.cos.name/2009/12/thoughts-about-2nd-r-conference/" title="第二届R会议随想">第二届R会议随想</a> (47)</li><li>2009/12/14 -- <a href="http://taiyun.cos.name/2009/12/all-about-the-2nd-r-conference/" title="第二届R会议那些事儿(上海)">第二届R会议那些事儿(上海)</a> (25)</li><li>2009/05/29 -- <a href="http://taiyun.cos.name/2009/05/1st-r-meeting-in-china-and-the-r-journal/" title="第一届R中国会议上了The R Journal第一期">第一届R中国会议上了The R Journal第一期</a> (1)</li><li>2011/05/10 -- <a href="http://taiyun.cos.name/2011/05/summary-of-first-data-mining-competition/" title="中科大之行及数据挖掘竞赛小总结">中科大之行及数据挖掘竞赛小总结</a> (16)</li><li>2009/11/07 -- <a href="http://taiyun.cos.name/2009/11/ten-thousand-jin-per-mu-and-so-called-common-sence-and-epistemology/" title="亩产万斤&#038;所谓常识&#038;认识论">亩产万斤&#038;所谓常识&#038;认识论</a> (5)</li><li>2009/07/13 -- <a href="http://taiyun.cos.name/2009/07/the-road-not-taken/" title="未选择的路—罗伯特·弗罗斯特">未选择的路—罗伯特·弗罗斯特</a> (0)</li><li>2011/07/04 -- <a href="http://taiyun.cos.name/2011/07/happy-birthday-professor-yan/" title="严老师生日快乐，淡定，给力以及治学">严老师生日快乐，淡定，给力以及治学</a> (2)</li><li>2009/04/01 -- <a href="http://taiyun.cos.name/2009/04/result-of/" title="美国数模竞赛结果出来了">美国数模竞赛结果出来了</a> (0)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2009/11/abrief-talk-on-buffon-throwing-needle-problems/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>亩产万斤&amp;所谓常识&amp;认识论</title>
		<link>http://taiyun.cos.name/2009/11/ten-thousand-jin-per-mu-and-so-called-common-sence-and-epistemology/</link>
		<comments>http://taiyun.cos.name/2009/11/ten-thousand-jin-per-mu-and-so-called-common-sence-and-epistemology/#comments</comments>
		<pubDate>Sat, 07 Nov 2009 08:06:08 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[文史哲思]]></category>
		<category><![CDATA[亩产万斤]]></category>
		<category><![CDATA[科学精神]]></category>
		<category><![CDATA[认识论]]></category>
		<category><![CDATA[钱学森]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=401</guid>
		<description><![CDATA[前几天，钱老仙去了，钱老当年的一篇关于论述农作物产量极限的“亩产万斤”的文章被广大人民挖了出来，从而催生了各种各样的评论文章。本文不具体评价任何人，也不再阐述钱老此文的假设条件等，而是着重讨论科学的精神以及我对此的一些浅薄的思考。 在这些评论文章中，经常出现的类似下面的悲哀的语句： 1. 亩产绝对不可能超万斤，这是一个最基本的生活常识。在一个正常的社会国家里，其国民对这应该有最起码的认识。 2. 亩产几万斤理论如果能让人们实现一万斤，或是几千斤都行，但，现实中明明连理论值的几十分之一都不到，那这也算科学就太可笑了吧。 3. 连三岁小孩子都不会相信亩产万斤的鬼话。 之所以说悲哀，是因为这些论断缺乏科学的精神，是一种人云亦云的愚蠢——没有调查数据，也没有分析论证，只有光秃秃结论，似乎是石头里面蹦出来的一样。无论是肯定还是否定一个命题，我都希望能看见其合理的理由。 我没有仔细查证文章所说的农作物究竟是什么，我仅仅列出我家（北方甘肃一个普通农民家庭）的作物收成数据：塑料大棚里面一亩地的茄子8个月（采摘期）平均收成4.3万斤、黄瓜6个月（采摘期）平均收成4.1万斤，一般田地里的萝卜、莴笋，收成都在1.5万斤以上，种玉米，收成2000斤左右。还要说明的是，我们家的产出在同一个村子里面也就是中等水平并且我们落后的边远小村庄在农业上根本谈不上先进。仅从这些来自落后边缘山区的数据来看，亩产万斤似乎也不是那么高不可攀。 但很可笑的是，我们一边吃着亩产万斤模式里培育出来的东西，而另一方面信誓旦旦地自以为否。很多持坚决否定意见的并不是农村的，对农产品的产出缺乏必要的认识。没有调查，就没有发言权。实在想发言，就得调查一番，但决不能以半个世纪前的经验数据、或者仅仅凭流言蜚语在自己心中的印象来判断目前和未来的状况。矛盾是发展的，当年的亩产万斤的确是奢望，但是，时过境迁，在今天、在未来应该是什么状况，最好还是研究一番，而不要轻易拍脑袋、下结论。 我们自小被填鸭惯了，学知识很多时候都是生吞活咽，没有一个主动消化的过程。长期以来，我们养成了这么一个习惯，就是严重的教条主义和人云亦云，学知识常常是是被动的接受和轻信，缺乏基本的辨别能力，更不用奢谈大胆假设、小心求证所体现的的怀疑精神和论证精神了。 因此，很多本该怀疑和论证的东西被扣上了“基本常识”的帽子，被奉为金科玉律而不可冒犯。在“所谓常识”的毒害下，我们根本没有去探讨能不能达到的具体原因，也不去调查实际情况，而只是轻率的、坚定地、信誓旦旦地接受了这一结论，仿佛最忠实的教徒供奉他们的真主一样——不需要任何理由，纯粹是一种心灵深处的信仰。 追本溯源，我们的认知缺失来自于传统文化的影响，也来自当今教育的失败。虽然，格物致知很早就被提出来了，但是历史上，格物致知这几个字我们完全不配说。大家都被束缚到严格的礼教之中，有创意的东西往往被视为奇技淫巧，礼法之所不容；我们灿烂的诸子百家的学说，没有一家像柏拉图学派、毕达哥拉斯学派等非常着重对客观世界的探索；我们的历史也近乎一部激烈的斗争史，崇尚的是权利、金钱和实用性，而不是有时看起来抽象、难以理解的数学；我们的认识论和《易经》一样飘渺，谈不上系统性和严谨性。由于认识论和价值文化的限制，我们的历史中不可能出现泰勒斯、毕达哥拉斯、牛顿、高斯、庞加莱等科学巨匠。 哲学是世界观和方法论的统一，而现在国内的中小学，哲学教育（尤其是认识论这一块）几乎完全是空白，课本中仅有的马克思哲学也被蒙上了政治色彩的面纱。而法国学生高考时，哲学是必考的，记得去年的题目似乎是论述“是否存在不可以被认识的事物”，试想，这样的题目我们学生能做成什么样？列出世界历史上彪炳史册的数学家、物理学家，你会发现他们几乎也都是清一色的哲学家，这个不是偶然，而是必然——人类需要哲学来武装自己，需要哲学来加深对事物的认识。我们一直叫嚷“我们缺乏大师”，但是却从来没想过为大师的成长创造条件。万丈高楼平地起，但是我们总是喜欢幻想空中楼阁巍然屹立。 扯得比较远了，有些观点可能有偏颇之处。最后，援引两句发人深省的话： 怀疑明显的东西；这样你将能清楚科学真理中那些含混不清的内容。任何能对明显的东西进行挑战的人，必定是十分勇敢的英雄。因为人们会认为这种挑战是疯狂的行为。 （克莱因《西方文化中的数学》） 我们先应该学会怀疑，再学会怀疑不那么明显的东西，再进一步学会怀疑明显的东西。我们离“怀疑明显的东西”这个层次还差好几个数量级。 最近在反复阅读20世纪最伟大的数学家之一克莱因先生的《西方文化中的数学》，此书将数学、哲学、历史、文化、文学结合起来谈，内容非常精彩，的确是大家手笔，我很喜欢。同时也感谢张祖贵先生，能将此书翻译得如此之好。 我们不能人云亦云，这不是科学精神，科学精神最重要的就是创新。……你是不是真正的创新，就看是不是敢于研究别人没有研究过的科学前沿问题，而不是别人已经说过的东西我们知道，没有说过的东西，我们就不知道。所谓优秀学生就是要有创新。……加州理工学院就有许多这样的大师、这样的怪人，决不随大流，敢于想别人不敢想的，做别人不敢做的。大家都说好的东西，在他看来很一般，没什么。没有这种精神，怎么会有创新！（钱学森） 我们要有属于自己的、理智的嘴巴和大脑，培养科学的精神，朝着“人格之独立，学术之自由”之路前进。本人对钱老的品格、治学无比敬佩，也谨以此文怀念钱老和勉励自己。 随机日志2009/02/05 -- R的sudoku包有待改进 (1)2009/12/24 -- 听丘成桐老师讲座之前中后 (53)2009/04/28 -- 四张机，鸳鸯织就欲双飞。可怜未老头先白。春波碧草，晓寒深处，相对浴红衣 (0)2009/12/14 -- 第二届R会议那些事儿(上海) (25)2010/04/18 -- corrplot 0.2-0版本出炉 (20)2011/12/09 -- 中小矩阵的可视化: corrplot 更新至 0.60 (5)2009/04/21 -- 《金刚经》之第十四品摘录 (0)2011/07/04 -- 严老师生日快乐，淡定，给力以及治学 (2)2009/03/25 -- 相关阵的圆圈图升级为围棋图 (0)2009/04/21 -- <a href='http://taiyun.cos.name/2009/11/ten-thousand-jin-per-mu-and-so-called-common-sence-and-epistemology/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<p>前几天，钱老仙去了，钱老当年的一篇关于论述农作物产量极限的“亩产万斤”的文章被广大人民挖了出来，从而催生了各种各样的评论文章。本文不具体评价任何人，也不再阐述钱老此文的假设条件等，而是着重讨论科学的精神以及我对此的一些浅薄的思考。</p>
<p>在这些评论文章中，经常出现的类似下面的悲哀的语句：</p>
<blockquote><p><strong><span style="color: #008000;">1. 亩产绝对不可能超万斤，这是一个最基本的生活常识。在一个正常的社会国家里，其国民对这应该有最起码的认识。<br />
2. 亩产几万斤理论如果能让人们实现一万斤，或是几千斤都行，但，现实中明明连理论值的几十分之一都不到，那这也算科学就太可笑了吧。<br />
3. 连三岁小孩子都不会相信亩产万斤的鬼话。</span><br />
</strong></p></blockquote>
<p><strong>之</strong>所以说悲哀，是因为这些论断缺乏科学的精神，是一种人云亦云的愚蠢——没有调查数据，也没有分析论证，只有光秃秃结论，似乎是石头里面蹦出来的一样。无论是肯定还是否定一个命题，我都希望能看见其合理的理由。</p>
<p>我没有仔细查证文章所说的农作物究竟是什么，我仅仅列出我家（北方甘肃一个普通农民家庭）的作物收成数据：塑料大棚里面一亩地的茄子8个月（采摘期）平均收成4.3万斤、黄瓜6个月（采摘期）平均收成4.1万斤，一般田地里的萝卜、莴笋，收成都在1.5万斤以上，种玉米，收成2000斤左右。还要说明的是，我们家的产出在同一个村子里面也就是中等水平并且我们落后的边远小村庄在农业上根本谈不上先进。仅从这些来自落后边缘山区的数据来看，亩产万斤似乎也不是那么高不可攀。</p>
<p>但很可笑的是，我们一边吃着亩产万斤模式里培育出来的东西，而另一方面信誓旦旦地自以为否。很多持坚决否定意见的并不是农村的，对农产品的产出缺乏必要的认识。没有调查，就没有发言权。实在想发言，就得调查一番，但决不能以半个世纪前的经验数据、或者仅仅凭流言蜚语在自己心中的印象来判断目前和未来的状况。矛盾是发展的，当年的亩产万斤的确是奢望，但是，时过境迁，在今天、在未来应该是什么状况，最好还是研究一番，而不要轻易拍脑袋、下结论。</p>
<p>我们自小被填鸭惯了，学知识很多时候都是生吞活咽，没有一个主动消化的过程。长期以来，我们养成了这么一个习惯，就是严重的教条主义和人云亦云，学知识常常是是被动的接受和轻信，缺乏基本的辨别能力，更不用奢谈大胆假设、小心求证所体现的的怀疑精神和论证精神了。</p>
<p>因此，很多本该怀疑和论证的东西被扣上了“基本常识”的帽子，被奉为金科玉律而不可冒犯。在“所谓常识”的毒害下，我们根本没有去探讨能不能达到的具体原因，也不去调查实际情况，而只是轻率的、坚定地、信誓旦旦地接受了这一结论，仿佛最忠实的教徒供奉他们的真主一样——不需要任何理由，纯粹是一种心灵深处的信仰。</p>
<p>追本溯源，我们的认知缺失来自于传统文化的影响，也来自当今教育的失败。虽然，格物致知很早就被提出来了，但是历史上，格物致知这几个字我们完全不配说。大家都被束缚到严格的礼教之中，有创意的东西往往被视为奇技淫巧，礼法之所不容；我们灿烂的诸子百家的学说，没有一家像柏拉图学派、毕达哥拉斯学派等非常着重对客观世界的探索；我们的历史也近乎一部激烈的斗争史，崇尚的是权利、金钱和实用性，而不是有时看起来抽象、难以理解的数学；我们的认识论和《易经》一样飘渺，谈不上系统性和严谨性。由于认识论和价值文化的限制，我们的历史中不可能出现泰勒斯、毕达哥拉斯、牛顿、高斯、庞加莱等科学巨匠。</p>
<p>哲学是世界观和方法论的统一，而现在国内的中小学，哲学教育（尤其是认识论这一块）几乎完全是空白，课本中仅有的马克思哲学也被蒙上了政治色彩的面纱。而法国学生高考时，哲学是必考的，记得去年的题目似乎是论述“是否存在不可以被认识的事物”，试想，这样的题目我们学生能做成什么样？列出世界历史上彪炳史册的数学家、物理学家，你会发现他们几乎也都是清一色的哲学家，这个不是偶然，而是必然——人类需要哲学来武装自己，需要哲学来加深对事物的认识。我们一直叫嚷“我们缺乏大师”，但是却从来没想过为大师的成长创造条件。万丈高楼平地起，但是我们总是喜欢幻想空中楼阁巍然屹立。</p>
<p>扯得比较远了，有些观点可能有偏颇之处。最后，援引两句发人深省的话：</p>
<blockquote><p><span style="color: #000080;"><strong>怀</strong><strong>疑明显的东西；这样你将能清楚科学真理中那些含混不清的内容。任何能对明显的东西进行挑战的人，必定是十分勇敢的英雄。因为人们会认为这种挑战是疯狂的行为。</strong></span> （克莱因《西方文化中的数学》）</p></blockquote>
<p>我们先应该学会怀疑，再学会怀疑不那么明显的东西，再进一步学会怀疑明显的东西。我们离“怀疑明显的东西”这个层次还差好几个数量级。</p>
<p>最近在反复阅读20世纪最伟大的数学家之一克莱因先生的《西方文化中的数学》，此书将数学、哲学、历史、文化、文学结合起来谈，内容非常精彩，的确是大家手笔，我很喜欢。同时也感谢张祖贵先生，能将此书翻译得如此之好。</p>
<blockquote><p><span style="color: #000080;"><strong>我们不能人云亦云，这不是科学精神，科学精神最重要的就是创新。……你是不是真正的创新，就看是不是敢于研究别人没有研究过的科学前沿问题，而不是别人已经说过的东西我们知道，没有说过的东西，我们就不知道。所谓优秀学生就是要有创新。……加州理工学院就有许多这样的大师、这样的怪人，决不随大流，敢于想别人不敢想的，做别人不敢做的。大家都说好的东西，在他看来很一般，没什么。没有这种精神，怎么会有创新！</strong></span>（钱学森）</p></blockquote>
<p>我们要有属于自己的、理智的嘴巴和大脑，培养科学的精神，朝着“人格之独立，学术之自由”之路前进。本人对钱老的品格、治学无比敬佩，也谨以此文怀念钱老和勉励自己。</p>
<h3  class="related_post_title">随机日志</h3><ul class="related_post"><li>2009/05/13 -- <a href="http://taiyun.cos.name/2009/05/r-and-regression/" title="R和回归肉的故事">R和回归肉的故事</a> (0)</li><li>2009/04/01 -- <a href="http://taiyun.cos.name/2009/04/result-of/" title="美国数模竞赛结果出来了">美国数模竞赛结果出来了</a> (0)</li><li>2011/10/08 -- <a href="http://taiyun.cos.name/2011/10/jiayi-liu-and-seetapum/" title="玉簪暗暗惜华年：刘嘉忆和Seetapun猜想">玉簪暗暗惜华年：刘嘉忆和Seetapun猜想</a> (6)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li><li>2009/05/11 -- <a href="http://taiyun.cos.name/2009/05/loujingshu/" title="《娄景书》预测2009年是涝灾之年">《娄景书》预测2009年是涝灾之年</a> (0)</li><li>2009/02/11 -- <a href="http://taiyun.cos.name/2009/02/comment-of-2009-mcm/" title="2009年MCM竞赛感言">2009年MCM竞赛感言</a> (0)</li><li>2009/04/21 -- <a href="http://taiyun.cos.name/2009/04/free-and-easy/" title="庄生逍遥游">庄生逍遥游</a> (0)</li><li>2008/10/14 -- <a href="http://taiyun.cos.name/2008/10/using-r-to-solve-optimization-problems/" title="《R软件与最优化》初稿已定">《R软件与最优化》初稿已定</a> (2)</li><li>2009/03/25 -- <a href="http://taiyun.cos.name/2009/03/circles-chart-of-corrmatrix-to-wiqi-chart/" title="相关阵的圆圈图升级为围棋图">相关阵的圆圈图升级为围棋图</a> (0)</li><li>2011/10/22 -- <a href="http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/" title="秋雨梧桐叶落时: corrplot包0.40版本出炉">秋雨梧桐叶落时: corrplot包0.40版本出炉</a> (12)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2009/11/ten-thousand-jin-per-mu-and-so-called-common-sence-and-epistemology/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>corrplot即将提交到CRAN</title>
		<link>http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/</link>
		<comments>http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/#comments</comments>
		<pubDate>Sun, 30 Aug 2009 20:41:00 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[可视分析]]></category>
		<category><![CDATA[可视化]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=191</guid>
		<description><![CDATA[之前，corrplot包（部分效果见此）只能通过Rforge下载： install.packages("corrplot", repos="http://R-Forge.R-project.org") 目前小bug都找的差不多了，加上近来比较忙碌，故打算提交到CRAN（大约五天之内会到CRAN上露脸吧），需要此包的朋友们就不用发email给我原始数据让我代劳了 此包以后的更新方向主要是变量的重排序方法： 1. Robinsonian 2. Dimension reduction 3. Heuristics 4. Block modeling 5. TSP 现在已经实现了主成分排序和各种系统聚类排序，其他的还得边学边卖，慢慢更新。相关矩阵可视化竟然能扯出这么多数学、统计甚至图论的东西，之前从没想到过，真是好玩。 注1：最初是在R会议上看见bjt大哥用椭圆图来表示相关矩阵，那时觉得很新鲜、很好玩，记忆很深刻。后来随便想了一阵子，写了个小函数来娱乐，却没想到滚雪球滚成了一个小package。 注2：曾经觉得自己折腾得太久了，很无聊，不过现在又觉得很好玩了，因为还有很多有趣的工作要做。 注3：corrplot包在Rforge上最近不太好用，等我忙完手头的事立即更新。 相关文章2011/12/09 -- 中小矩阵的可视化: corrplot 更新至 0.60 (5)2010/05/29 -- 相关矩阵中置信区间之涂鸦 (10)2009/08/23 -- 距离矩阵可视化&#038;用TSP方法重排变量 (0)2009/04/21 -- 相关阵的方块图 (0)2011/10/22 -- 秋雨梧桐叶落时: corrplot包0.40版本出炉 (12)2011/05/03 -- 第四届R会议, R与最优化 (7)2011/04/20 -- EBImage包以及学术模特Lena的八卦 (4)2011/04/13 -- 周总理与小波分析 (小波分析连载系列之零) (12)2010/05/10 -- 国内三大经济期刊合作作者关系网络及其可视化 (19)2010/04/18 <a href='http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<div id="blog_text" class="cnt">之前，corrplot包（<a href="http://cos.name/bbs/read.php?tid=15158" target="_blank">部分效果见此</a>）只能通过Rforge下载：</p>
<pre class="sh_slang">
install.packages("corrplot", repos="http://R-Forge.R-project.org")</pre>
<p>目前小bug都找的差不多了，加上近来比较忙碌，故打算提交到CRAN（大约五天之内会到CRAN上露脸吧），需要此包的朋友们就不用发email给我原始数据让我代劳了<img src="http://img.baidu.com/hi/jx/j_0045.gif" alt="" /></p>
<p>此包以后的更新方向主要是变量的重排序方法：</p>
<p><strong>1. Robinsonian<br />
2. Dimension reduction<br />
3. Heuristics<br />
4. Block modeling<br />
5. TSP</strong></p>
<p>现在已经实现了主成分排序和各种系统聚类排序，其他的还得边学边卖，慢慢更新。相关矩阵可视化竟然能扯出这么多数学、统计甚至图论的东西，之前从没想到过，真是好玩。</p>
<p><span style="font-family: 黑体;"><strong>注1：</strong></span>最初是在R会议上看见bjt大哥用椭圆图来表示相关矩阵，那时觉得很新鲜、很好玩，记忆很深刻。后来随便想了一阵子，写了个<a href="http://cos.name/2009/03/correlation-matrix-visualization/" target="_blank">小函数</a>来娱乐，却没想到滚雪球滚成了一个小package。</p>
<p><span style="font-family: 黑体;"><strong>注2：</strong></span>曾经觉得自己折腾得太久了，很无聊，不过现在又觉得很好玩了，因为还有很多有趣的工作要做。</p>
<p><span style="font-family: 黑体; color: #ff0000;"><strong>注3：</strong><span style="font-family: 宋体;">corrplot包在Rforge上最近</span></span><span style="color: #ff0000;">不太好用，等我忙完手头的事立即更新。</span></div>
<script type="text/javascript" src="/wp-content/plugins/shjs-syntax-hiliter/shjs/lang/sh_slang.js"></script><h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2011/12/09 -- <a href="http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/" title="中小矩阵的可视化: corrplot 更新至 0.60">中小矩阵的可视化: corrplot 更新至 0.60</a> (5)</li><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2009/08/23 -- <a href="http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/" title="距离矩阵可视化&#038;用TSP方法重排变量">距离矩阵可视化&#038;用TSP方法重排变量</a> (0)</li><li>2009/04/21 -- <a href="http://taiyun.cos.name/2009/04/squares-chart-of-correlation-matrix/" title="相关阵的方块图">相关阵的方块图</a> (0)</li><li>2011/10/22 -- <a href="http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/" title="秋雨梧桐叶落时: corrplot包0.40版本出炉">秋雨梧桐叶落时: corrplot包0.40版本出炉</a> (12)</li><li>2011/05/03 -- <a href="http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/" title="第四届R会议, R与最优化">第四届R会议, R与最优化</a> (7)</li><li>2011/04/20 -- <a href="http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/" title="EBImage包以及学术模特Lena的八卦">EBImage包以及学术模特Lena的八卦</a> (4)</li><li>2011/04/13 -- <a href="http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/" title="周总理与小波分析 (小波分析连载系列之零)">周总理与小波分析 (小波分析连载系列之零)</a> (12)</li><li>2010/05/10 -- <a href="http://taiyun.cos.name/2010/05/co-author-network-in-chinese-three-top-journal/" title="国内三大经济期刊合作作者关系网络及其可视化">国内三大经济期刊合作作者关系网络及其可视化</a> (19)</li><li>2010/04/18 -- <a href="http://taiyun.cos.name/2010/04/corrplot-0-20-came-out/" title="corrplot 0.2-0版本出炉">corrplot 0.2-0版本出炉</a> (20)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>距离矩阵可视化&amp;用TSP方法重排变量</title>
		<link>http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/</link>
		<comments>http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/#comments</comments>
		<pubDate>Sun, 23 Aug 2009 22:26:00 +0000</pubDate>
		<dc:creator>魏太云</dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[可视分析]]></category>
		<category><![CDATA[PCA]]></category>
		<category><![CDATA[TSP]]></category>
		<category><![CDATA[可视化]]></category>

		<guid isPermaLink="false">http://taiyun.cos.name/?p=192</guid>
		<description><![CDATA[前两周在北大上可视化的暑期班，有幸和五湖四海的朋友们一起聆听Kwan-Liu Ma、Han-Wei Shen、Alex Pang、Michelle Zhou、Hua-min Qu、Jean-Daniel Fekete、Jian Huang、田捷等老师的教诲，这些老师、研究人员在各自的领域内都非常优秀，部分还是界内大牛，更可敬的是他们都对学生很有感情、很有耐心——标准的德艺双馨。 整个暑期班的学习中，课程包含流体可视化、张量可视化、医学影像、信息可视化、时变可视化、智能可视化、并行可视化等很多方面，其中我最感兴趣的是：Jean-Daniel的Visualizing Social Networks using Hybrid Matrix/Node-Link Representations，因为和我之前的工作颇有渊源。 Jean-Daniel在做social network的时候，用到了类似相关矩阵可视化的东西，就是将两两之间的关系数字化，得到一个相似度矩阵，然后可视化这个矩阵。social network的传统做法是画个网络图，用节点和连线来表示，但这样很容易使整个图变得乱七八糟，什么也看不清。可视化相似度矩阵的方法则不存在这个问题，当然也会带来新的麻烦。 对于相似度矩阵的可视化，主要存在两个问题： 1. 如何用颜色、图形、线条表示这个矩阵，； 2. 如何对矩阵对应的变量进行重排序，使得相似的变量聚在一起，不相似的分开，这样我们可以通过可视化的图形直观地发掘变量之间内在的关系。 其中，第一点已经很成熟了，就是用方块、圆，再辅之以渐变色等，corrplot包的初期也就是做这些工作；而第二点，即如何重现排序变量，这会涉及到统计、数学知识，也是本问题的精髓之所在。之前，我仅知道用PCA、聚类等方法重排变量，也在corrplot包中实现了。而现在，我发现重排变量是个不小的问题，因为它本身非常重要，而PCA、聚类方法有时在效果或者速度上并不占优势，这就需要我们探索其他方法。Jean-Daniel在课堂上介绍了两个， Robinsonian和TSP。Robinsonian是个很数学的东西，我暂时还没有翻看论文，但是TSP（Travelling salesman problem）大家都再熟悉不过了，把这个东西灵活地用在变量排序中，的确是别出心裁，匪夷所思！！相似度、相关系数等本身都是距离，而TSP问题恰恰求最短路的。 TSP是个NP问题，但很幸运的是，我们目前已经有很多算法可以快速得到不错的解，R中有相关的包（TSP），包含了常见算法并提供了concorde软件（解TSP问题的优秀开源软件）的接口。这样一来，写个用TSP排列变量函数就方便很多了。 当然，除了TSP问题的求解难度问题之外，它在变量排序中还存在一个问题，就是TSP问题求出的最短路是个环线，所以在重排序的变量中，第一个和最后一个可能很相似，但在图中，它们一个最上、一个最下，离得最远。这个问题可以这么解决： 1. 不在一张图上吊死。用至少两张图，第二张图的变量顺序是第一个图的水平移动，比如第一个图中（A, B, C, D, E)，而第二个图则是（D, E, A, B, C），这样第二个图中E和A就在一起了。当然，我们也可以通过观察图形，得到一个最容易接受的排序。这虽然是个解决方法，但是人总是贪婪而又懒惰的，一张图能看清楚的，绝不会看两张图，因此还需要探索一张图的方法。 2. 不在一个算法上吊死。既然TSP可以，那么图论中经典的Dijkstra 、Floyd算法也很可能适用，虽然这两个算法不是穷尽各个节点的，而是求各个节点之间的最小路程。比如，我们可以通过这两个算法辅助TSP算法确定起点和终点：我们可以求出网络中任意两点间的距离，然后找出最大距离所对应的两个节点。然后，将距离矩阵中这两个节点所对应的距离修改为0，这样得到的结果中这两个节点肯定挨在一起，这相当于将TSP环路算法转换为非环路算法。然后，将这两个节点分别设置为头尾，就可以得到一个粗糙的结果了。我在R中试了试，基于经典的mtcars数据，将得到的图展示出来： 从上图可以看到，两种排序方法还是比较相似的，并且效果都不错。这样确定起点终点的好处是，起点和终点对应线路是所有两两路程中最长的，这样再用非环线的TSP算法就不容易使排序失去意义。当然，这种方法还是很粗糙，比如计算量过大。实际中，我们可以通过别的方法更快地确定起始点和终点。 3. 不在一种介质上吊死。常见的纸、屏幕是平面的，如果我们有圆柱形式的立体介质，那么TSP得到的变量重排序就很有舞台了。将图绘制在圆柱上，首尾相接，看的时候转动圆柱即可。这个方法听起来的确有些扯，但是我觉得这种介质的出现不是没有可能（实际上，一些路边的广告就是这样的），当然这种方法的局限性也很大。 等手头的杂事忙完的话，corrplot包也会逐步更新，添加一些变量排序的新方法。可视化不是简单的画图，背后的算法、模型非常重要。 注： 1. 已经有很多文献讨论了矩阵的重排序，不过我都没看，先自己折腾一番。 2. 本文之前写得不太明了，因此重新修改了，2009-08-27，19:16。 相关文章2011/12/09 -- 中小矩阵的可视化: corrplot <a href='http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/'>[...]</a>]]></description>
			<content:encoded><![CDATA[<div id="blog_text" class="cnt">前两周在北大上<a href="http://vis.pku.edu.cn/wiki/doku.php?id=public_course:summerschool_s09:start" target="_blank">可视化的暑期班</a>，有幸和五湖四海的朋友们一起聆听Kwan-Liu Ma、Han-Wei Shen、Alex Pang、Michelle Zhou、Hua-min Qu、Jean-Daniel Fekete、Jian Huang、田捷等老师的教诲，这些老师、研究人员在各自的领域内都非常优秀，部分还是界内大牛，更可敬的是他们都对学生很有感情、很有耐心——标准的德艺双馨。</p>
<p>整个暑期班的学习中，课程包含流体可视化、张量可视化、医学影像、信息可视化、时变可视化、智能可视化、并行可视化等很多方面，其中我最感兴趣的是：Jean-Daniel的<a href="http://vis.pku.edu.cn/wiki/doku.php?id=public_course:summerschool_s09:program:start" target="_blank">Visualizing Social Networks using Hybrid Matrix/Node-Link Representations</a>，因为和我之前的工作颇有渊源。</p>
<p>Jean-Daniel在做social network的时候，用到了类似相关矩阵可视化的东西，就是将两两之间的关系数字化，得到一个相似度矩阵，然后可视化这个矩阵。social network的传统做法是画个网络图，用节点和连线来表示，但这样很容易使整个图变得乱七八糟，什么也看不清。可视化相似度矩阵的方法则不存在这个问题，当然也会带来新的麻烦。</p>
<p>对于相似度矩阵的可视化，主要存在两个问题：<br />
1. 如何用颜色、图形、线条表示这个矩阵，；<br />
2. 如何对矩阵对应的变量进行重排序，使得相似的变量聚在一起，不相似的分开，这样我们可以通过可视化的图形直观地发掘变量之间内在的关系。</p>
<p>其中，第一点已经很成熟了，就是用方块、圆，再辅之以渐变色等，corrplot包的初期也就是做这些工作；而第二点，即如何重现排序变量，这会涉及到统计、数学知识，也是本问题的精髓之所在。之前，我仅知道用PCA、聚类等方法重排变量，也在corrplot包中实现了。而现在，我发现重排变量是个不小的问题，因为它本身非常重要，而PCA、聚类方法有时在效果或者速度上并不占优势，这就需要我们探索其他方法。Jean-Daniel在课堂上介绍了两个， Robinsonian和TSP。Robinsonian是个很数学的东西，我暂时还没有翻看论文，但是TSP（Travelling salesman problem）大家都再熟悉不过了，把这个东西灵活地用在变量排序中，的确是别出心裁，匪夷所思！！相似度、相关系数等本身都是距离，而TSP问题恰恰求最短路的。</p>
<p>TSP是个NP问题，但很幸运的是，我们目前已经有很多算法可以快速得到不错的解，R中有相关的包（TSP），包含了常见算法并提供了concorde软件（解TSP问题的优秀开源软件）的接口。这样一来，写个用TSP排列变量函数就方便很多了。</p>
<p>当然，除了TSP问题的求解难度问题之外，它在变量排序中还存在一个问题，就是TSP问题求出的最短路是个环线，所以在重排序的变量中，第一个和最后一个可能很相似，但在图中，它们一个最上、一个最下，离得最远。这个问题可以这么解决：</p>
<p>1. <strong><span style="color: #0000ff;">不在一张图上吊死。</span></strong>用至少两张图，第二张图的变量顺序是第一个图的水平移动，比如第一个图中（A, B, C, D, E)，而第二个图则是（D, E, A, B, C），这样第二个图中E和A就在一起了。当然，我们也可以通过观察图形，得到一个最容易接受的排序。这虽然是个解决方法，但是人总是贪婪而又懒惰的，一张图能看清楚的，绝不会看两张图，因此还需要探索一张图的方法。</p>
<p>2. <strong><span style="color: #0000ff;">不在一个算法上吊死。</span></strong>既然TSP可以，那么图论中经典的Dijkstra 、Floyd算法也很可能适用，虽然这两个算法不是穷尽各个节点的，而是求各个节点之间的最小路程。<span style="color: #0000ff;"><strong>比如，我们可以通过这两个算法辅助TSP算法确定起点和终点</strong></span>：我们可以求出网络中任意两点间的距离，然后找出最大距离所对应的两个节点。然后，将距离矩阵中这两个节点所对应的距离修改为0，这样得到的结果中这两个节点肯定挨在一起，这相当于将TSP环路算法转换为非环路算法。然后，将这两个节点分别设置为头尾，就可以得到一个粗糙的结果了。我在R中试了试，基于经典的mtcars数据，将得到的图展示出来：<br />
<img class="aligncenter size-full wp-image-235" title="vis-tsp-pca" src="http://taiyun.cos.name/wp-content/uploads/2009/10/vis-tsp-pca.jpg" alt="vis-tsp-pca" width="624" height="325" /><br />
从上图可以看到，两种排序方法还是比较相似的，并且效果都不错。<span style="color: #0000ff;"><strong>这样确定起点终点的好处是，起点和终点对应线路是所有两两路程中最长的，这样再用非环线的TSP算法就不容易使排序失去意义。</strong></span>当然，这种方法还是很粗糙，比如计算量过大。实际中，我们可以通过别的方法更快地确定起始点和终点。<br />
<span style="font-size: 10.5pt;"> </span></p>
<p>3. <span style="font-size: 10.5pt;"><strong><span style="color: #0000ff;">不在一种介质上吊死。</span></strong>常见的纸、屏幕是平面的，如果我们有圆柱形式的立体介质，那么</span><span style="font-size: 10.5pt;">TSP</span><span style="font-size: 10.5pt;">得到的变量重排序就很有舞台了。将图绘制在圆柱上，首尾相接，看</span><span style="font-size: 10.5pt;">的时候转动圆柱即可。这个方法听起来的确有些扯，但是我觉得这种介质的出现不是没有可能（实际上，一些路边的广告就是这样的），当然这种方法的局限性也很大。</span></p>
<p><span style="font-size: 10.5pt;">等手头的杂事忙完的话，</span><span style="font-size: 10.5pt;"><a href="http://r-forge.r-project.org/projects/corrplot/" target="_blank">corrplot<span><span>包</span></span></a></span><span style="font-size: 10.5pt;">也会逐步更新，添加一些变量排序的新方法。<span style="color: #0000ff;"><strong>可视化不是简单的画图，背后的算法、模型非常重要</strong><strong>。</strong></span></span></p>
<p><span style="color: #0000ff;"><strong> </strong></span><span style="color: #0000ff;"><strong><span style="color: #000000;">注：<br />
1. 已经有很多文献讨论了矩阵的重排序，不过我都没看，先自己折腾一番。<br />
2. 本文之前写得不太明了，因此重新修改了，2009-08-27，19:16。</span><br />
</strong></span></div>
<h3  class="related_post_title">相关文章</h3><ul class="related_post"><li>2011/12/09 -- <a href="http://taiyun.cos.name/2011/12/corrplot-update-to-0-60/" title="中小矩阵的可视化: corrplot 更新至 0.60">中小矩阵的可视化: corrplot 更新至 0.60</a> (5)</li><li>2010/05/29 -- <a href="http://taiyun.cos.name/2010/05/visualization-of-ci-in-correlation-matrix/" title="相关矩阵中置信区间之涂鸦">相关矩阵中置信区间之涂鸦</a> (10)</li><li>2009/08/30 -- <a href="http://taiyun.cos.name/2009/08/submit-corrplot-to-cran/" title="corrplot即将提交到CRAN">corrplot即将提交到CRAN</a> (0)</li><li>2009/04/21 -- <a href="http://taiyun.cos.name/2009/04/squares-chart-of-correlation-matrix/" title="相关阵的方块图">相关阵的方块图</a> (0)</li><li>2011/10/22 -- <a href="http://taiyun.cos.name/2011/10/corrplot-new-version-0-40/" title="秋雨梧桐叶落时: corrplot包0.40版本出炉">秋雨梧桐叶落时: corrplot包0.40版本出炉</a> (12)</li><li>2011/05/03 -- <a href="http://taiyun.cos.name/2011/05/chinar-2011-r-and-optimization/" title="第四届R会议, R与最优化">第四届R会议, R与最优化</a> (7)</li><li>2011/04/20 -- <a href="http://taiyun.cos.name/2011/04/ebimage-package-and-academic-model-lena/" title="EBImage包以及学术模特Lena的八卦">EBImage包以及学术模特Lena的八卦</a> (4)</li><li>2011/04/13 -- <a href="http://taiyun.cos.name/2011/04/premier-zhou-and-wavelet/" title="周总理与小波分析 (小波分析连载系列之零)">周总理与小波分析 (小波分析连载系列之零)</a> (12)</li><li>2010/05/10 -- <a href="http://taiyun.cos.name/2010/05/co-author-network-in-chinese-three-top-journal/" title="国内三大经济期刊合作作者关系网络及其可视化">国内三大经济期刊合作作者关系网络及其可视化</a> (19)</li><li>2010/04/18 -- <a href="http://taiyun.cos.name/2010/04/corrplot-0-20-came-out/" title="corrplot 0.2-0版本出炉">corrplot 0.2-0版本出炉</a> (20)</li></ul>]]></content:encoded>
			<wfw:commentRss>http://taiyun.cos.name/2009/08/an-application-of-tsp-in-matrix-visualization/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

