raynix 筆記

Category: Python & Frameworks

A Simple Python IO Trick

I thought using Python’s gzip is quite straight forward, however the IO performance almost doubled with an extra BufferedWriter: import io import gzip def export_to_json_gz(schema): json_file = “test.json.gz” with io.BufferedWriter( gzip.open(temp_dir + json_file, ‘wb’) ) as gzfile: for row in stream_table_data(schema): ujson.dump(row, gzfile, ensure_ascii=False) gzfile.write(‘\n’) Now the bottle neck…

December 12, 2016
学TurboGears 2顺便还得学习一下Genshi

Genshi是Python环境下的一个比较出名的HTML/XML/…模板框架. 作为TurboGears2.1缺省的模板组件, Genshi得到了很多好评. 我也正是因为TG粘合了如此优秀的组件而决心学习TG的. TG2.1样本项目里的主模板文件master.html的完整解释: http://www.turbogears.org/2.1/docs/main/master_html.html#master-html Genshi模板基础: http://genshi.edgewall.org/wiki/Documentation/templates.html 首先, 在TG2中通过@expose decorator来为一个View(V in MVC)指定Genshi模板. 如果不需要模板, 就是: @expose() def hello(self): return “Hello world from controller.” 这样在缺省的开发环境下, 访问http://127.0.0.1:8080/hello, 将得到简单的 Hello world from controller. 当然, 这除了测试似乎没有什么实际意义. 然后是使用模板的版本: @expose(‘example.templates.index’) def new_hello(self): return dict(hello=”New text from controller + template “, page=”new_hello”) 这样, TG会寻找example项目下的example/templates/index.html作为new_hello的模板. 同时, 将两个key传递给模板: hello和page. 而在index模板内, 可以很随意的调用这两个获得的key. <h1 py:content=”hello”>old Hello, world.</h1> Now…

July 30, 2011
学习Python + TurboGears 2

前一阵子我着实的困惑了几分钟: 下半辈子做什么呢? 当别人努力的stand out时, 我却在不停的试图blend in. 好在依旧自信, 我索性说, who cares, 我要继续学习我想学的东西: 互联网技术+摄影, 不管有没有搞头, 应该不至于挨饿. 废话到此为止. 选择TG而淘汰Django的原因是TG的耦合度较低, 而且学习难度要大些. 你了解我的, 我喜欢做难度大的事情, 例如投胎到中国. TG目前的版本是2.1, 安装方法可以参考: http://www.turbogears.org/2.1/docs/main/DownloadInstall.html 在Ubuntu环境下, 先安装必要基础: $ sudo aptitude install build-essential python-dev python-setuptools python-virtualenv 然后在CLI里如下方法开始第一个TG项目: $ virtualenv –no-site-packages -p python2.6 tg2env $ cd tg2env/ $ source bin/activate (tg2env)$ easy_install -i http://www.turbogears.org/2.1/downloads/current/index tg.devtools (tg2env)$ paster quickstart example…

July 29, 2011
Unicode编码中的简繁中文互转

现在简繁中文的转换已经不像从前那样，是gbk/ big5两种文字编码之间的转换，而是在同一个编码，Unicode，当中不同编码的映射。当然，简繁中文绝对不是简单的一一对应关系，有一对多的个别情况，例如简体的“后” 对应繁体的 “后”和“後”。行业词汇也有差别，例如大陆说“宽带”，而港台说“寬頻”；大陆说“操作系统”，而港台说“作業系統” 等等。因此当我决定用Python程序将森海塞尔简体中文网站转换为繁体中文网站时，我的计划分三个步骤：提取行业高频关键字，找到简体和繁体的对应，编成词典利用现有的Python中文本地化工具包，将关键字之外的文字转换请港台Freelancer人工校对，确保本土化第一步，我的词典替换程序在此：第二步，我利用的是pyzh中文工具包中的fanjian.py完成。特别感谢pyzh项目组的全部成员和fanjian.py程序作者ne.manman和zsp007！下面就交给香港的朋友了，希望不会累坏他:) 顺便说，Songbird很不错，有点山寨iTunes，那又怎样呢？毕竟Linux下面还没iTunes。 Songbird

April 30, 2009
从6.7到0.01

编程果然不能偷懒！我这一偷懒，CPU就不知道要受多少累、冒多少热气了。一开始，我采用了很无脑的穷举方法，复杂度是O(n**2)，结果肯定正确的，但是长度一万的数组就可以耗去6.7秒的CPU时间。 raymond@raymond-laptop:~/_Work/Dev/python$ python le.py time: 0:00:06.708924 return: 1 0 0 0 之后，在高手提示下将复杂度降低到n (log n + 1) ，结果不错了。 raymond@raymond-laptop:~/_Work/Dev/python$ python le.py time: 0:00:00.010430 return: 1 0 0 0 对应改进后的代码： def leader3(array): t = len(array) //2 array.sort() p = -1 c = 1 for i in array: if p == i : c+=1 if c > t:…

April 20, 2009
偷闲，写了个初级二叉树排序

二叉树是计算机算法中普遍采用的数据结构。在所有排序算法中具有高效率的二叉树排序就是基于此结构。我抽空用新学的Python写了一个试试： class node: left = None right = None value = 0 def __init__(self, v): self.value = v def walk(self): r = [] if self.left: r.extend(self.left.walk()) r.append(self.value) if self.right: r.extend(self.right.walk()) return r def insert(self, n): if self.value < n: if self.right: self.right.insert(n) else: self.right = node(n) else: if self.left: self.left.insert(n) else: self.left = node(n) if…

April 14, 2009
Python＋Django笔记之三

关于urls.py 假设test项目下有一个应用模块notes，那么： test/urls.py： from django.conf.urls.defaults import * urlpatterns = patterns(‘ ‘, (r’^notes/’, include(‘notes.urls’)), … ) 这样所有匹配/notes/*的访问将转交给notes/urls.py处理。 test/notes/urls.py: … urlpatterns = patterns(‘ ‘, url(r’^list/$’, views.list_notes, name=’note_list’), url(r’^(?P<note_id>\d+)/$’, views.show_note, name=’note_show’), ) 首先，由于需要反向解析（页面名称->URL），所以要使用url()，而不是原来的tuple。对应url(r’^list/$’, views.list_notes, name=’note_list’), 将匹配/notes/list/的访问指向给views.py中的list_notes()方法，并将’note_list’名称反向解析到/notes/list/的URL，以便在webapp中生成链接。第二行中的(?P<note_id>\d+)是一个参数定义，其中note_id是参数名，\d+说明此参数是一个数字。其实起到的作用就是将/note/123/这样的url解释成一个调用show_note(request, note_id=123)。如果参数不是数字而是字词，那么\d+应该改为\w+，具体定义可以参考regex规则。

March 12, 2009
Python＋Django笔记之二

一个简单的select * 操作的Django方式：首先配置urls.py from django.conf.urls.defaults import * from misc import views urlpatterns = patterns(‘ ‘, (r’^notes/$’, views.list_notes), ) 其中r’^notes/$’是regex，用于匹配url；views.list_notes是views.py中的list_notes 方法。然后写list_notes: def list_notes(request): notes = Note.objects.order_by(‘-created_date’) conduit = { ‘notes’: notes } return render_to_response( ‘misc/list.html’, conduit, context_instance = RequestContext(request), ) 其中conduit这个词来自Mass Effect 🙂 最后就是把上面的misc/list.html写出来： {% extends “base.html” %} {% block title %}List Notes –…

February 25, 2009