Category: Python & Frameworks

  • Unicode编码中的简繁中文互转

    现在简繁中文的转换已经不像从前那样,是gbk/ big5两种文字编码之间的转换,而是在同一个编码,Unicode,当中不同编码的映射。当然,简繁中文绝对不是简单的一一对应关系,有一对多的个别情况,例如简体的“后” 对应繁体的 “后”和“後”。行业词汇也有差别,例如大陆说“宽带”,而港台说“寬頻”;大陆说“操作系统”,而港台说“作業系統” 等等。 因此当我决定用Python程序将森海塞尔简体中文网站转换为繁体中文网站时,我的计划分三个步骤: 提取行业高频关键字,找到简体和繁体的对应,编成词典 利用现有的Python中文本地化工具包,将关键字之外的文字转换 请港台Freelancer人工校对,确保本土化 第一步,我的词典替换程序在此: 第二步,我利用的是pyzh中文工具包中的fanjian.py完成。特别感谢pyzh项目组的全部成员和fanjian.py程序作者ne.manman和zsp007! 下面就交给香港的朋友了,希望不会累坏他:) 顺便说,Songbird很不错,有点山寨iTunes,那又怎样呢?毕竟Linux下面还没iTunes。 Songbird

  • 从6.7到0.01

    编程果然不能偷懒!我这一偷懒,CPU就不知道要受多少累、冒多少热气了。一开始,我采用了很无脑的穷举方法,复杂度是O(n**2),结果肯定正确的,但是长度一万的数组就可以耗去6.7秒的CPU时间。 [email protected]:~/_Work/Dev/python$ python le.py time:  0:00:06.708924 return:  1 0 0 0 之后,在高手提示下将复杂度降低到n (log n + 1) ,结果不错了。 [email protected]:~/_Work/Dev/python$ python le.py time:  0:00:00.010430 return:  1 0 0 0 对应改进后的代码: def leader3(array): t = len(array) //2 array.sort() p = -1 c = 1 for i in array: if p == i : c+=1 if c > t: […]

  • 偷闲,写了个初级二叉树排序

    二叉树是计算机算法中普遍采用的数据结构。在所有排序算法中具有高效率的二叉树排序就是基于此结构。我抽空用新学的Python写了一个试试: class node: left = None right = None value = 0 def __init__(self, v): self.value = v def walk(self): r = [] if self.left: r.extend(self.left.walk()) r.append(self.value) if self.right: r.extend(self.right.walk()) return r def insert(self, n): if self.value < n: if self.right: self.right.insert(n) else: self.right = node(n) else: if self.left: self.left.insert(n) else: self.left = node(n) if […]

  • Python+Django笔记之三

    关于urls.py 假设test项目下有一个应用模块notes,那么: test/urls.py: from django.conf.urls.defaults import * urlpatterns = patterns(‘ ‘, (r’^notes/’, include(‘notes.urls’)), … ) 这样所有匹配/notes/*的访问将转交给notes/urls.py处理。 test/notes/urls.py: … urlpatterns = patterns(‘ ‘, url(r’^list/$’, views.list_notes, name=’note_list’), url(r’^(?P<note_id>\d+)/$’, views.show_note, name=’note_show’), ) 首先,由于需要反向解析(页面名称->URL),所以要使用url(),而不是原来的tuple。对应url(r’^list/$’, views.list_notes, name=’note_list’), 将匹配/notes/list/的访问指向给views.py中的list_notes()方法,并将’note_list’名称反向解析到/notes/list/的URL,以便在webapp中生成链接。 第二行中的(?P<note_id>\d+)是一个参数定义,其中note_id是参数名,\d+说明此参数是一个数字。其实起到的作用就是将/note/123/这样的url解释成一个调用show_note(request, note_id=123)。如果参数不是数字而是字词,那么\d+应该改为\w+,具体定义可以参考regex规则。

  • Python+Django笔记之二

    一个简单的select * 操作的Django方式: 首先配置urls.py from django.conf.urls.defaults import * from misc import views urlpatterns = patterns(‘ ‘, (r’^notes/$’, views.list_notes), ) 其中r’^notes/$’是regex,用于匹配url;views.list_notes是views.py中的list_notes 方法。 然后写list_notes: def list_notes(request): notes = Note.objects.order_by(‘-created_date’) conduit = { ‘notes’: notes } return render_to_response( ‘misc/list.html’, conduit, context_instance = RequestContext(request), ) 其中conduit这个词来自Mass Effect 🙂 最后就是把上面的misc/list.html写出来: {% extends “base.html” %} {% block title %}List Notes – […]

  • Python+Django笔记之一

    副标题:PGB: Project Galactica Board 启动 从无到有启动一个Django project(Django发音类似Jungle),以pgb为例: >django-admin.py startproject pgb 设置数据库连接: >vim pgb/settings.py DATABASE_ENGINE = ‘mysql’           # ‘postgresql_psycopg2’, ‘postgresql’, ‘mysql’, ‘sqlite3’ or ‘oracle’. DATABASE_NAME = ‘pgb’             # Or path to database file if using sqlite3. DATABASE_USER = ‘root’             # Not used with sqlite3. DATABASE_PASSWORD = ‘xxxxxx’         # Not used with sqlite3. 建立一个app(app可以看作项目的一个模块,一个app是一系列相关功能的集合,而且可以被多个project共用): >cd pgb >python […]