Tornado框架使用http的GET方式传输中文汉字的简单实作

最近业余时间在看Tornado框架的使用,虽然维基百科「Comparison of web application frameworks把Tornado黑的不行,但上手确实很简单


技术分享

这个教程的第二个例子


import textwrap

import tornado.httpserver
import tornado.ioloop
import tornado.options
import tornado.web

from tornado.options import define, options
define("port", default=8000, help="run on the given port", type=int)


class ReverseHandler(tornado.web.RequestHandler):
    def get(self, input):
        self.write(input[::-1] + '\n')

class WrapHandler(tornado.web.RequestHandler):
    def post(self):
        text = self.get_argument('text')
        width = self.get_argument('width', 40)
        self.write(textwrap.fill(text, int(width)) + '\n')
        
class FindbrandHandler( tornado.web.RequestHandler ):
    def get(self, input):
        input_dcds = input.split('_')
        input_dcd = u''
        for elem in input_dcds:
            if len(elem)>0:
                input_dcd += unichr( int(elem) )
        print input_dcd.encode('utf-8')
        
        o_str = 'input: '+input_dcd.encode('utf-8') + '\noutput: getcha\n'
        self.write( o_str )

if __name__ == "__main__":
    tornado.options.parse_command_line()
    app = tornado.web.Application(
        handlers=[
            (r"/reverse/(\w+)", ReverseHandler),
            (r"/wrap", WrapHandler),
            (r"/brand/(\w+)", FindbrandHandler)
        ]
    )
    http_server = tornado.httpserver.HTTPServer(app)
    http_server.listen(options.port)
    tornado.ioloop.IOLoop.instance().start()

例程的逻辑如下:

添加FindbrandHandle类,继承RequestHandler,重写get方法

按照

/brand/(请求内容)

的方式载入web.Application,然后运行。


用curl请求:

curl localhost:9002/reverse/1234567

会得到如下返回

7654321


然而输入中文

curl localhost:9002/reverse/从星星的弹空里

会得到404页

<html><title>404: Not Found</title><body>404: Not Found</body></html>


这是因为http的GET方法,不支持汉语,仅支持字母数字符号。早些年某些浏览器访问百度,也往往看见百度将搜索词,使用urlencode方法,转化为GET方法支持的url字符串。

这里我们使用unichr()和ord()两个函数,实现unicode字符与整形数的转换,发送用下划线间隔的整形数。

这里是客户端例程:

import os
import sys

import nlp_tools as nt

urlstr = 'curl localhost:%d/brand/%s'

if __name__=='__main__':
    
    n_args = len(sys.argv)
    
    line = sys.argv[2]
    
    ecd_data = ''
    for word in line.decode('utf-8'):
        ecd_data += '%d_'%( ord(word) )
    
    url_request = ''
    if n_args==2:
        url_request = urlstr%( 8000, ecd_data )
    else:
        url_request = urlstr%( int(sys.argv[1]), ecd_data )
        
    print line
    print url_request

    os.system( url_request )

使用


python call_string_service1.py 9002 从星星的弹空里


调用该脚本,既可查看执行结果:


从星星的弹空里
curl localhost:9002/brand/20174_26143_26143_30340_24377_31354_37324_
input: 从星星的弹空里
output: getcha


本实作使用自写编码方式,简单演示其他url_encode模块的工作原理,实现了中文汉字的传输。

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。