搜档网
当前位置:搜档网 › Python正则表达式re模块简明笔记

Python正则表达式re模块简明笔记

Python正则表达式re模块简明笔记
Python正则表达式re模块简明笔记

Python正则表达式re模块简明笔记

要注意的是,正则表达式并不是一个程序,而是用于处理字符串的一种模式,如果你想用它来处理字符串,就必须使用支持正则表达式的工具,比如Linux 中的awk, sed, grep,或者编程语言Perl, Python, Java 等等。

作者:FunHacks来源:FunHacks|2016-12-28 11:20

收藏

分享

简介

正则表达式(regular expression)是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。比如,正则表达式‘hello’ 可以匹配字符串‘hello’。

要注意的是,正则表达式并不是一个程序,而是用于处理字符串的一种模式,如果你想用它来处理字符串,就必须使用支持正则表达式的工具,比如Linux 中的awk, sed, grep,或者编程语言Perl, Python, Java 等等。

正则表达式有多种不同的风格,下表列出了适用于Python 或Perl 等编程语言的部分元字符以及说明:

re 模块

在Python 中,我们可以使用内置的re 模块来使用正则表达式。

有一点需要特别注意的是,正则表达式使用\对特殊字符进行转义,比如,为了匹配字符串‘https://www.sodocs.net/doc/2f3669190.html,’,我们需要使用正则表达式'python\.org',而Python 的字符串本身也用\转义,所以上面的正则表达式在Python 中应该写成'python\\.org',这会很容易陷入\的困扰中,因此,我们建议使用Python 的原始字符串,只需加一个r 前缀,上面的正则表达式可以写成:

r'python\.org'

re 模块提供了不少有用的函数,用以匹配字符串,比如:

?compile 函数

?match 函数

?search 函数

?findall 函数

?finditer 函数

?split 函数

?sub 函数

?subn 函数

re 模块的一般使用步骤如下:

?使用compile 函数将正则表达式的字符串形式编译为一个Pattern 对象

?通过Pattern 对象提供的一系列方法对文本进行匹配查找,获得匹配结果(一个Match 对象)

?最后使用Match 对象提供的属性和方法获得信息,根据需要进行其他的操作

compile 函数

compile 函数用于编译正则表达式,生成一个Pattern 对象,它的一般使用形式如下:

https://www.sodocs.net/doc/2f3669190.html,pile(pattern[, flag])

其中,pattern 是一个字符串形式的正则表达式,flag 是一个可选参数,表示匹配模式,比如忽略大小写,多行模式等。

下面,让我们看看例子。

import re

# 将正则表达式编译成Pattern 对象

pattern = https://www.sodocs.net/doc/2f3669190.html,pile(r'\d+')

在上面,我们已将一个正则表达式编译成Pattern 对象,接下来,我们就可以利用pattern 的一系列方法对文本进行匹配查找了。Pattern 对象的一些常用方法主要有:

?match 方法

?search 方法

?findall 方法

?finditer 方法

?split 方法

?sub 方法

?subn 方法

match 方法

match 方法用于查找字符串的头部(也可以指定起始位置),它是一次匹配,只要找到了一个匹配的结果就返回,而不是查找所有匹配的结果。它的一般使用形式如下:

match(string[, pos[, endpos]])

其中,string 是待匹配的字符串,pos 和endpos 是可选参数,指定字符串的起始和终点位置,默认值分别是0 和len (字符串长度)。因此,当你不指定pos 和endpos 时,match 方法默认匹配字符串的头部。

当匹配成功时,返回一个Match 对象,如果没有匹配上,则返回None。

看看例子。

>>> import re

>>> pattern = https://www.sodocs.net/doc/2f3669190.html,pile(r'\d+') # 用于匹配至少一个数字

>>> m = pattern.match('one12twothree34four') # 查找头部,没有匹配

>>> print m

None

>>> m = pattern.match('one12twothree34four', 2, 10) # 从'e'的位置开始匹配,没有匹配

>>> print m

None

>>> m = pattern.match('one12twothree34four', 3, 10) # 从'1'的位置开始匹配,正好匹配

>>> print m # 返回一个Match 对象

<_sre.SRE_Match object at 0x10a42aac0>

>>> m.group(0) # 可省略0

'12'

>>> m.start(0) # 可省略0

3

>>> m.end(0) # 可省略0

5

>>> m.span(0) # 可省略0

(3, 5)

在上面,当匹配成功时返回一个Match 对象,其中:

?group([group1, …])方法用于获得一个或多个分组匹配的字符串,当要获得整个匹配的子串时,可直接使用group()或group(0);

?start([group])方法用于获取分组匹配的子串在整个字符串中的起始位置(子串第一个字符的索引),参数默认值为0;

?end([group])方法用于获取分组匹配的子串在整个字符串中的结束位置(子串最后一个字符的索引+1),参数默认值为0;

?span([group])方法返回(start(group), end(group))。

再看看一个例子:

>>> import re

>>> pattern = https://www.sodocs.net/doc/2f3669190.html,pile(r'([a-z]+) ([a-z]+)', re.I) # re.I 表示忽略大小写

>>> m = pattern.match('Hello World Wide Web')

>>> print m # 匹配成功,返回一个Match 对象

<_sre.SRE_Match object at 0x10bea83e8>

>>> m.group(0) # 返回匹配成功的整个子串

'Hello World'

>>> m.span(0) # 返回匹配成功的整个子串的索引

(0, 11)

>>> m.group(1) # 返回第一个分组匹配成功的子串

'Hello'

>>> m.span(1) # 返回第一个分组匹配成功的子串的索引

(0, 5)

>>> m.group(2) # 返回第二个分组匹配成功的子串

'World'

>>> m.span(2) # 返回第二个分组匹配成功的子串

(6, 11)

>>> m.groups() # 等价于(m.group(1), m.group(2), ...)

('Hello', 'World')

>>> m.group(3) # 不存在第三个分组

Traceback (most recent call last):

File "", line 1, in IndexError: no such group

search 方法

search 方法用于查找字符串的任何位置,它也是一次匹配,只要找到了一个匹配的结果就返回,而不是查找所有匹配的结果,它的一般使用形式如下:

search(string[, pos[, endpos]])

其中,string 是待匹配的字符串,pos 和endpos 是可选参数,指定字符串的起始和终点位置,默认值分别是0 和len (字符串长度)。

当匹配成功时,返回一个Match 对象,如果没有匹配上,则返回None。

让我们看看例子:

>>> import re

>>> pattern = https://www.sodocs.net/doc/2f3669190.html,pile('\d+')

>>> m = pattern.search('one12twothree34four') # 这里如果使用match 方法则不匹配

>>> m

< _sre.SRE_Match object at 0x10cc03ac0>

>>> m.group()

'12'

>>> m = pattern.search('one12twothree34four', 10, 30) # 指定字符串区间

>>> m

< _sre.SRE_Match object at 0x10cc03b28>

>>> m.group()

'34'

>>> m.span()

(13, 15)

再来看一个例子:

# -*- coding: utf-8 -*-

import re

# 将正则表达式编译成Pattern 对象

pattern = https://www.sodocs.net/doc/2f3669190.html,pile(r'\d+')

# 使用search() 查找匹配的子串,不存在匹配的子串时将返回None

# 这里使用match() 无法成功匹配

m = pattern.search('hello 123456 789')

if m:

# 使用Match 获得分组信息

print 'matching string:',m.group()

print 'position:',m.span()

执行结果:

matching string: 123456

position: (6, 12)

findall 方法

上面的match 和search 方法都是一次匹配,只要找到了一个匹配的结果就返回。然而,在大多数时候,我们需要搜索整个字符串,获得所有匹配的结果。

findall 方法的使用形式如下:

findall(string[, pos[, endpos]])

其中,string 是待匹配的字符串,pos 和endpos 是可选参数,指定字符串的起始和终点位置,默认值分别是0 和len (字符串长度)。

findall 以列表形式返回全部能匹配的子串,如果没有匹配,则返回一个空列表。

看看例子:

pattern = https://www.sodocs.net/doc/2f3669190.html,pile(r'\d+') # 查找数字

result1 = pattern.findall('hello 123456 789')

result2 = pattern.findall('one1two2three3four4', 0, 10)

print result1

print result2

执行结果:

['123456', '789']

['1', '2']

finditer 方法

finditer 方法的行为跟findall 的行为类似,也是搜索整个字符串,获得所有匹配的结果。但它返回一个顺序访问每一个匹配结果(Match 对象)的迭代器。

看看例子:

# -*- coding: utf-8 -*-

import re

pattern = https://www.sodocs.net/doc/2f3669190.html,pile(r'\d+')

result_iter1 = pattern.finditer('hello 123456 789')

result_iter2 = pattern.finditer('one1two2three3four4', 0, 10)

print type(result_iter1)

print type(result_iter2)

print 'result1...'

for m1 in result_iter1: # m1 是Match 对象

print 'matching string: {}, position: {}'.format(m1.group(), m1.span())

print 'result2...'

for m2 in result_iter2:

print 'matching string: {}, position: {}'.format(m2.group(), m2.span())

执行结果:

< type 'callable-iterator'>

matching string: 123456, position: (6, 12)

matching string: 789, position: (13, 16)

result2...

matching string: 1, position: (3, 4)

matching string: 2, position: (7, 8)

split 方法

split 方法按照能够匹配的子串将字符串分割后返回列表,它的使用形式如下:

split(string[, maxsplit])

其中,maxsplit 用于指定最大分割次数,不指定将全部分割。

看看例子:

import re

p = https://www.sodocs.net/doc/2f3669190.html,pile(r'[\s\,\;]+')

print p.split('a,b;; c d')

执行结果:

['a', 'b', 'c', 'd']

sub 方法

sub 方法用于替换。它的使用形式如下:

sub(repl, string[, count])

其中,repl 可以是字符串也可以是一个函数:

?如果repl 是字符串,则会使用repl 去替换字符串每一个匹配的子串,并返回替换后的字符串,另外,repl 还可以使用\id的形式来引用分组,但不能使用编号0;

?如果repl 是函数,这个方法应当只接受一个参数(Match 对象),并返回一个字符串用于替换(返回的字符串中不能再引用分组)。

count 用于指定最多替换次数,不指定时全部替换。

看看例子:

import re

p = https://www.sodocs.net/doc/2f3669190.html,pile(r'(\w+) (\w+)')

s = 'hello 123, hello 456'

def func(m):

return 'hi' + ' ' + m.group(2)

print p.sub(r'hello world', s) # 使用'hello world' 替换'hello 123' 和'hello 456'

print p.sub(r'\2 \1', s) # 引用分组

print p.sub(func, s)

print p.sub(func, s, 1) # 最多替换一次

执行结果:

hello world, hello world

123 hello, 456 hello

hi 123, hi 456

hi 123, hello 456

subn 方法

subn 方法跟sub 方法的行为类似,也用于替换。它的使用形式如下:

subn(repl, string[, count])

它返回一个元组:

(sub(repl, string[, count]), 替换次数)

元组有两个元素,第一个元素是使用sub 方法的结果,第二个元素返回原字符串被替换的次数。看看例子:

import re

p = https://www.sodocs.net/doc/2f3669190.html,pile(r'(\w+) (\w+)')

s = 'hello 123, hello 456'

def func(m):

return 'hi' + ' ' + m.group(2)

print p.subn(r'hello world', s)

print p.subn(r'\2 \1', s)

print p.subn(func, s)

print p.subn(func, s, 1)

执行结果:

('hello world, hello world', 2)

('123 hello, 456 hello', 2)

('hi 123, hi 456', 2)

('hi 123, hello 456', 1)

其他函数

事实上,使用compile 函数生成的Pattern 对象的一系列方法跟re 模块的多数函数是对应的,但在使用上有细微差别。

match 函数

match 函数的使用形式如下:

re.match(pattern, string[, flags]):

其中,pattern 是正则表达式的字符串形式,比如\d+, [a-z]+。

而Pattern 对象的match 方法使用形式是:

match(string[, pos[, endpos]])

可以看到,match 函数不能指定字符串的区间,它只能搜索头部,看看例子:

import re

m1 = re.match(r'\d+', 'One12twothree34four')

if m1:

print 'matching string:',m1.group()

else:

print 'm1 is:',m1

m2 = re.match(r'\d+', '12twothree34four')

if m2:

print 'matching string:', m2.group()

else:

print 'm2 is:',m2

执行结果:

m1 is: None

matching string: 12

search 函数

search 函数的使用形式如下:

re.search(pattern, string[, flags])

search 函数不能指定字符串的搜索区间,用法跟Pattern 对象的search 方法类似。findall 函数

findall 函数的使用形式如下:

re.findall(pattern, string[, flags])

findall 函数不能指定字符串的搜索区间,用法跟Pattern 对象的findall 方法类似。看看例子:

import re

print re.findall(r'\d+', 'hello 12345 789')

# 输出

['12345', '789']

finditer 函数

finditer 函数的使用方法跟Pattern 的finditer 方法类似,形式如下:

re.finditer(pattern, string[, flags])

split 函数

split 函数的使用形式如下:

re.split(pattern, string[, maxsplit])

sub 函数

sub 函数的使用形式如下:

re.sub(pattern, repl, string[, count])

subn 函数

subn 函数的使用形式如下:

re.subn(pattern, repl, string[, count])

到底用哪种方式

从上文可以看到,使用re 模块有两种方式:

?使用https://www.sodocs.net/doc/2f3669190.html,pile 函数生成一个Pattern 对象,然后使用Pattern 对象的一系列方法对文本进行匹配查找;?直接使用re.match, re.search 和re.findall 等函数直接对文本匹配查找;

下面,我们用一个例子展示这两种方法。

先看第1 种用法:

import re

# 将正则表达式先编译成Pattern 对象

pattern = https://www.sodocs.net/doc/2f3669190.html,pile(r'\d+')

print pattern.match('123, 123')

print pattern.search('234, 234')

print pattern.findall('345, 345')

再看第2 种用法:

import re

print re.match(r'\d+', '123, 123')

print re.search(r'\d+', '234, 234')

print re.findall(r'\d+', '345, 345')

如果一个正则表达式需要用到多次(比如上面的\d+),在多种场合经常需要被用到,出于效率的考虑,我们应该预先编译该正则表达式,生成一个Pattern 对象,再使用该对象的一系列方法对需要匹配的文件进行匹配;而如果直接使用re.match, re.search 等函数,每次传入一个正则表达式,它都会被编译一次,效率就会大打折扣。

因此,我们推荐使用第1 种用法。

匹配中文

在某些情况下,我们想匹配文本中的汉字,有一点需要注意的是,中文的unicode 编码范围主要在[\u4e00-\u9fa5],这里说主要是因为这个范围并不完整,比如没有包括全角(中文)标点,不过,在大部分情况下,应该是够用的。

假设现在想把字符串title = u'你好,hello,世界'中的中文提取出来,可以这么做:

# -*- coding: utf-8 -*-

import re

title = u'你好,hello,世界'

pattern = https://www.sodocs.net/doc/2f3669190.html,pile(ur'[\u4e00-\u9fa5]+')

result = pattern.findall(title)

print result

注意到,我们在正则表达式前面加上了两个前缀ur,其中r表示使用原始字符串,u表示是unicode 字符串。执行结果:

[u'\u4f60\u597d', u'\u4e16\u754c']

贪婪匹配

在Python 中,正则匹配默认是贪婪匹配(在少数语言中可能是非贪婪),也就是匹配尽可能多的字符。

比如,我们想找出字符串中的所有div块:

import re

content = 'aa

test1
bb
test2
cc'

pattern = https://www.sodocs.net/doc/2f3669190.html,pile(r'

.*
')

result = pattern.findall(content)

print result

执行结果:

['

test1
bb
test2
']

由于正则匹配是贪婪匹配,也就是尽可能多的匹配,因此,在成功匹配到第一个

时,它还会向右尝试匹配,查看是否还有更长的可以成功匹配的子串。

如果我们想非贪婪匹配,可以加一个?,如下:

import re

content = 'aa

test1
bb
test2
cc'

pattern = https://www.sodocs.net/doc/2f3669190.html,pile(r'

.*?
') # 加上?

result = pattern.findall(content)

print result

结果:

['

test1
', '
test2
']

小结

re 模块的一般使用步骤如下:

?使用compile 函数将正则表达式的字符串形式编译为一个Pattern 对象;

?通过Pattern 对象提供的一系列方法对文本进行匹配查找,获得匹配结果(一个Match 对象);?最后使用Match 对象提供的属性和方法获得信息,根据需要进行其他的操作;

Python 的正则匹配默认是贪婪匹配。

【编辑推荐】

1.干货分享:Python开发的高级技巧

2.Python内存问题:提示和技巧

3.盘点十大隐藏在Python中的彩蛋

4.Python爬虫爬取美剧网站

5.Python程序员都该用的一个库

正则表达式 Regular Expression 例子 sample VB版

VS SDK Regular Expression Language Service Example Deep Dive (VB) István Novák (DiveDeeper), Grepton Ltd. May, 2008 Introduction This example implements a small language service for demonstration purposes. This is called Regular Expression Language Service since it can tokenize text by RegEx patterns (lower case letters, capital letters, digits) and can use its own syntax coloring scheme for each token. However, the functionality of this sample is quite far away from a full language service it illustrates the basics. The source files belonging to this code have only about three hundred lines of essential code. When reading through this deep dive you are going to get familiar with the following concepts: How language services should be registered with Visual Studio? What kind of lifecycle management tasks a simple language service has? How to create a very simple language service? How to implement a scanner supporting syntax coloring? To understand concepts treated here it is assumed that you are familiar with the idea of VSPackages and you know how to build and register very simple (even non-functional) packages. To get more information about packages, please have a look at the Package Reference Sample (VisualBasic Reference.Package sample). Very basic knowledge about regular expressions is also expected. Regular Expression Language Service Open the Microsoft Visual Studio 2008 SDK Browser and select the Samples tab. In the top middle list you can search for the “VisualBasic Example.RegExLangServ” sample. Please, use the “Open this sample in Visual Studio” link at the top right panel of the browser app to prepare the sample. The application opens in Visual Studio 2008. Running the sample Rebuild the package and start it with the Experimental Hive! Without creating a new solution, add a new text file with the File|New|File... menu function. Use the File|Save As menu function to store the text file with the RegexFile.rgx name. To avoid attaching the .txt extension to the end of the file name, set the “Save as type” to “All files (*.*)” as illustrated in Figure 1:

python学习笔记

1、python中的函数以def来定义,利用缩进来表示函数的完整性,Python 函数没有明显的begin和end, 没有花括号, 用于标函数的开始和结束。唯一的分隔符是一个冒号(:), 接着代码本身是缩进的。如: def hello(): print “Hello,world\n” hello() #调用hello函数 2、所有的Python 模块都是对象并且有几个有用的属性。您可以使用这些属性方便地测试您所书写的模块。下面是一个使用if__name__的技巧。 if __name__ == "__main__": 3、d = {"server":"mpilgrim", "database":"master"} Python中的hash表,利用key来进行查询值 当使用dictionary 时, 您需要知道: dictionary 的key 是大小写敏感的。 Del d[key]:删除某个值 d.clear:清空整个hash队列 4、li = ["a", "b", "mpilgrim", "z", "example"] Python中的数组 li[0:3]:表示从0-2,结果为:['a', 'b', 'mpilgrim'] append 向 list 的末尾追加单个元素。 insert 将单个元素插入到 list 中。数值参数是插入点的索引。请注意, list 中的元素不必唯一, 现在有两个独立的元素具有 'new' 这个值, li[2] 和li[6]。 extend 用来连接 list。请注意不要使用多个参数来调用 extend, 要使用一个 list 参数进行调用。在本例中, 这个 list 有两个元素。 extend (扩展) 与append (追加)的差别 >>> li = ['a', 'b', 'c'] >>> li.extend(['d', 'e', 'f']) >>> li ['a', 'b', 'c', 'd', 'e', 'f'] >>> len(li) 6 >>> li[-1] 'f' >>> li = ['a', 'b', 'c'] >>> li.append(['d', 'e', 'f']) >>> li ['a', 'b', 'c', ['d', 'e', 'f']] >>> len(li) 4 >>> li[-1] ['d', 'e', 'f'] Lists 的两个方法 extend 和 append 看起来类似, 但实际上完全不同。 extend 接受一个参数, 这个参数总是一个 list, 并且添加这个 list 中的

ragel学习

Ragel学习笔记 解决的问题 采用一个连续的可能庞大的正则表达式,可以有一些分块式action,或者只是判断某一串符合此表达式。采用解决问题模型为有限状态机。 语法 嵌入C, C++, Objective-C, D, Go,Java and Ruby. 多行代码 %%{ … … }%% 单行代码%% 实例代码 #include #include %%{ machine foo; main := ( 'foo' | 'bar' ) 0 @{ res = 1; }; }%% %% write data; int main( int argc, char **argv ) { int cs, res = 0; if ( argc > 1 ) { char *p = argv[1]; char *pe = p + strlen(p) + 1; %% write init; %% write exec; } printf("result = %i\n", res ); return 0; }

状态机名 machine fsm_name; 必须在块开头注明,如上例。如果没注明则用先前使用的,如没有则报错。可以采用多文件编译include为关键字导入文件。 定义语句 = ; 名为name的state直到定义实例化(被引用时(下一个为:=形式))才生成,该语句类似一个类的定义 状态机实例化 := ; 该语句产生状态机的一个状态,名为main的状态为初始start状态。 %% write init // 该命令设置cs (current_state) 为main的状态,即为start状态 如果没有main 则最近一个实例化的状态即为开始状态。 在外部执行控制语句可以通过设置cs来设置状态机,内部执行,采用fcall fgoto fnext实现状态切换。 导入ragel代码 include FsmName "inputfile.rl"; 如果没名会与当前状态机同名,如果没输入文件,则导入FsmName,检索路径与当前文件相同,可以通过-I命令增加include 检索路径,同makefile。 导入定义 import "inputfile.h"; 文件内容形如:(单引号类似命令标记)定义name 为number(纯数字) 或者lit_string(字符串) name '=' number name '=' lit_string 'define' name number 'define' name lit_string 如果输入文件为一个ragel 程序则忽略所有tokens,检索路径与当前文件相同,可以通过-I 命令增加import检索路径,同include。

黑马程序员python基础班教程笔记使

爬?基本原理 爬?是模拟?户在浏览器或者App应?上的操作,把操作的过程、实现?动化的程序 当我们在浏览器中输??个url后回?,后台会发?什么? 简单来说这段过程发?了以下四个步骤: 查找域名对应的IP地址。 浏览器?先访问的是DNS(Domain Name System,域名系统),dns的主要 ?作就是把域名转换成相应的IP地址 向IP对应的服务器发送请求。 服务器响应请求,发回??内容。 浏览器显示??内容。 浏览器是如何发送和接收这个数据呢? HTTP协议(HyperText Transfer Protocol,超?本传输协议)?的是为了提供?种发布和接收HTML(HyperText Markup Language)??的?法。 HTTPS(全称:Hypertext Transfer Protocol over Secure Socket Layer),是以安全为?标的HTTP通道,简单讲是HTTP的安全版。 使?urllib爬取数据 1.urlopen( ) 打开?个url的?法,返回?个?件对象,然后可以进?类似?件对象的操作 2.urlretrieve( ) urlretrieve?法将url定位到的html?件下载到你本地的硬盘中。 如果不指定filename,则会存为临时?件。 urlretrieve()返回?个?元组(filename,mine_hdrs) 2.1 不指定路径 说明:清除由于urllib.urlretrieve()所产?的缓存 2.2 指定路径

2.3 urlencode( ) 上?的程序演示了最基本的??抓取,不过,现在?多数?站都是动态? ?,需要你动态地传递参数给它,它做出对应的响应。所以,在访问时,我们需要传递数据给它。最常?的情况是什么?对了,就是登录注册的时候呀。把数据?户名和密码传送到?个URL,然后你得到服务器处理之后的响应,这个该怎么办?下?让我来为?伙伴们揭晓吧!数据传送分为POST和 GET两种?式两种?式有什么区别呢?最重要的区别是GET?式是直接以链接形式访问,链接中包含了所有的参数,当然如果包含了密码的话是?种不安全的选择,不过你可以直观地看到 ??提交了什么内容。 POST则不会在?址上显示所有的参数,不过如果你想直接查看提交了什么就不太?便了,?家可以酌情选择。 这?可以与urlopen结合以实现post?法和get?法: GET?法

arcgis中Python脚本的使用【简明教程】

[初学入门]ArcGIS中Python脚本的使用 By:飞天小猪 目录 写在前面的话 (2) 前言 (2) 一、PYTHON语言基础 (3) 1数学运算符 (3) 2字符串操作 (4) 3模块的使用(M ODULES) (5) 4使用DEF构建函数 (6) 5流程控制结构:I F,W HILE,F OR (7) 6简单输入和输出 (9) 二、ARCGIS&PYTHON (10) 1如何创建地理处理对象(GEOPROCESSOR OBJECT) (10) 2获取地理处理帮助 (11) 2.1举例:如何使用Geoprocessor Programming Model中的Lists (11) 3使用地理处理工具——T OOLBOXES和A LIASES (12) 4在建模中使用脚本(S CRIPTS IN M ODEL B UILDER) (13) 5在P YTHON W IN里调试地理处理脚本 (19) 5.1 调试选择和消息 (20) 5.2PythonWin的调试工具 (21) 5.3地理处理工具举例 (22) 6使用描述(D ESCRIBE)和存在(E XISTS)获取数据信息 (22) 6.1描述 (23) 6.2存在(Exists) (24) 6.3在循环中使用描述和存在 (24) 7在P YTHON脚本中使用地图代数(M AP A LGEBRA) (27) 8数据管理和指针(D ATA M ANAGEMENT AND C URSORS) (28) 8.1数据管理(Data Management) (28) 8.2指针(Cursors) (29) 附录1:地理处理脚本中输入&输出方法指南 (32) 附录2:其他 (33)

最新《笨办法学python》学习笔记

《笨办法学python》学习笔记(Python 3.6) 习题19 ex19.py # -*- coding: utf-8 -*- # 定义cheese_and_crackers这个函数,该函数有两个参数,分别是cheese_count 和boxes_of_crackers. # 函数其实就是个print的集合 def cheese_and_crackers(cheese_count,boxes_of_crackers): print("You have %d cheeses!" %cheese_count) print("You have %d boxes of crackers!" %boxes_of_crackers) print("Man that's enough for a party!") print("Get a blanket.\n") #屏幕上首先显示下一行的语句。 print("We can just give the function numbers directy:") # 调用了这个函数,带入两个参数(20, 30) cheese_and_crackers(20,30) print("OR,we can use variables from our script:") # 定义两个变量 amount_of_cheese=10 amount_of_crackers=50 #将定义的两个变量作为参数引入到函数中。 cheese_and_crackers(amount_of_cheese,amount_of_crackers) print("We can even do math inside too:") # 引入的参数是一个运算式 cheese_and_crackers(10+20,5+6) print("And we can combine the two,variables and math:") cheese_and_crackers(amount_of_cheese+100,amount_of_crackers+1000) #自编练习1 def my_exercise_prg(prg1,prg2): print("The fisrt number is %d." %prg1) print("The second number is %d."%prg2) print("The first number and the second number equals " ,end="") print(prg1+prg2,".") print("Let's do math!") prg1=2 prg2=7 my_exercise_prg(prg1,prg2) #自编练习2

Python基础教程(自学记录)精编版

第一章快速改造:基础知识 1.2交互式解释器 在IDLE编辑器,在提示符后输入help然后按回车;也可以按下F1获得有关IDLE的帮助信息 1.4数字和表达式 1/2返回0,整除除法;1.0/2返回0.5,用一个或者多个包含小数点的数字参与计算。另外改变除法的执行方式:from_future_import division //可以实现整除,1.0//2.0返回0.0 %取余数;**幂运算; >>> 1/2

>>> 1.0/2 0.5 >>> 1.0//2.0 0.0 >>> 10%3 1 >>> 9**(1/2) 1 >>> 9**(1.0/2) 3.0 >>> 2.75%0.5 0.25 >>> -9%4 3 >>> -3%2 1 >>> -3/2 -2 1.4.1长整数 普通整数不能大于2147483647也不能小于-2147483648,若更大的数,可以使用长整数。长整数结尾有个L,理论上小写也可以,不过为了便于识别,尽可能用大写。

1.4.2十六进制和八进制 0XAF返回175 ,十六进制; 010返回8,八进制 >>> 0xAF 175 >>> 010 8 1.5变量 包含字母、数字和下划线。首字母不能是数字开头。 1.8函数 Pow计算乘方:pow(2,3),2**3均返回8;pow等标准函数称为内建函数。 Abs(-10)求绝对值,返回10;round(1.0/2.0)返回1.0,把浮点数四舍五入为最接近的整数值。 >>> pow(2,3) 8 >>> 2**3 8 >>> abs(-10) 10 >>> round(1.0/2.0) 1.0

正则表达式 (1)

正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。 列目录时,dir *.txt或ls *.txt中的*.txt就不是一个正则表达式,因为这里*与正则式的*的含义是不同的。 正则表达式是由普通字符(例如字符a 到z)以及特殊字符(称为元字符)组成的文字模式。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。 3.1 普通字符 由所有那些未显式指定为元字符的打印和非打印字符组成。这包括所有的大写和小写字母字符,所有数字,所有标点符号以及一些符号。 3.2 非打印字符 字符含义 \cx 匹配由x指明的控制字符。例如,\cM 匹配一个Control-M 或回车符。x 的值必须为A-Z 或a-z 之一。否则,将c 视为一个原义的‘c’ 字符。 \f 匹配一个换页符。等价于\x0c 和\cL。 \n 匹配一个换行符。等价于\x0a 和\cJ。 \r 匹配一个回车符。等价于\x0d 和\cM。 \s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。\S 匹配任何非空白字符。等价于[^ \f\n\r\t\v]。 \t 匹配一个制表符。等价于\x09 和\cI。 \v 匹配一个垂直制表符。等价于\x0b 和\cK。

3.5 定位符 用来描述字符串或单词的边界,^和$分别指字符串的开始与结束,\b描述单词的前或后边界,\B表示非单词边界。不能对定位符使用限定符。 3.6 选择 用圆括号将所有选择项括起来,相邻的选择项之间用|分隔。但用圆括号会有一个副作用,是相关的匹配会被缓存,此时可用?:放在第一个选项前来消除这种副作用。 其中?:是非捕获元之一,还有两个非捕获元是?=和?!,这两个还有更多的含义,前者为正向预查,在任何开始匹配圆括号内的正则表达式模式的位置来匹配搜索字符串,后者为负向预查,在任何开始不匹配该正则表达式模式的位置来匹配搜索字符串。 3.7 后向引用 对一个正则表达式模式或部分模式两边添加圆括号将导致相关匹配存储到一个临时缓冲区中,所捕获的每个子匹配都按照在正则表达式模式中从左至右所遇到的内容存储。存储子匹配的缓冲区编号从1 开始,连续编号直至最大99 个子表达式。每个缓冲区都可以使用‘\n’ 访问,其中n 为一个标识特定缓冲区的一位或两位十进制数。 可以使用非捕获元字符‘?:’, ‘?=’, or ‘?!’ 来忽略对相关匹配的保存。 4. 各种操作符的运算优先级 相同优先级的从左到右进行运算,不同优先级的运算先高后低。各种操作符的优先级从高到低如下: 操作符描述 \ 转义符 (), (?:), (?=), [] 圆括号和方括号 *, +, ?, {n}, {n,}, {n,m} 限定符 ^, $, \anymetacharacter 位置和顺序 | “或”操作 5. 全部符号解释

hp_unix学习笔记

第一部分: UNIX系统基础 第一章: UNIX shell 1. UNIX操作系统的核心称为内核,内核是处理用户软件和计算机硬件之间所有通信的一个软件.由内核决定如何同外围设备通信等等.UNIX用户是无法与内核直接交互的,而是经常同一个叫做UNIX shell的程序打交道.shell是一个命令解释器.shell接受用户的命令,解释它们并采取必要的动作去执行这个命令.这也为用户提供这些命令的输出. Shell是一个UNIX用户的命令解释器。它从用户那里取得输入并根据输入完成一个动作。内部命令内置在shell中而,外置命令以单独的文件保存。 如果你使用了一个长度大于8的口令,第8个字符以后的字符被忽略。 2. 在UNIX系统中,每一个用户都有一个独一无二的号码和用户名联系在一起,这个号码叫做User ID. Root 用户的ID是0 因此任何用户拥有了这个ID也就拥有了超级用户权限. 3. $表示为普通用户. #表示为超级用户. 4. 按ESC+K: 重新执行上一次的命令. 5. History命令用来回调以前使用过的命令. History -3 :显示最近使用的三个命令. 6. 别名: alias dir=ls 用dir来取代ls 7.启动文件有两种:系统启动文件和用户启动文件.系统启动文件对系统中所有用户都是通用的,但用户启动文件可以为每一个用户定制. HP-UX系统的启动文件叫作profile 存放在/etc目录下 用户的启动文件叫作.profile 存放在用户的主目录下. 8. w命令会告诉你系统已经启动多长时间,当前的时间及登录的用户在做什么. 9.命令链接是为了给频繁使用的命令提供一个较短的名字. 10.打印标签: banner 字符 banner yujile. 11.cal 显示日历 12.shell允许用户在单独一行里输入多个命令.每个命令之间用冒号分隔. 13.请注意口令长度必须为6~8个字符,并且同时包括字符和数字.口令中至少有两个字符是字母而且至少有一个是数字或特殊字符.(第八个字符以后的字符都会被忽略) 第二章:管理文件和目录 1.创建文件 cat>文件名注意:在每一行的结尾按Enter, 完成文本的输入后按ctrl+d以结束文本输入过程并保存文件。 2.在UNIX里执行文件没有特殊的名字,文件权限显示哪个文件是可执行的,哪个是不可执行的。 3.ls –a 可以显示隐含文件包括以一个点(.)开头的隐含文件 4.文件权限d 表示目录–表示常规文件 5.ls –f 或 lsf 命令在显示目录时:在目录名结尾附加―/‖符号。 6.rm –rf 删除一个非空目录。不会对用户有任何警告。 7.UNIX文件系统由目录和文件构成,顶级目录叫做根目录,用―/‖符号表示,所有其他目录和文件在根目录里面。一个目录的上一级叫做父目录,而下一级目录叫做子目录。8.无论何时创建一个新目录,两个条目自动创建在新目录里,它们是―.‖(参照于当前目录)和―..‖(参照于当前目录的父目录)―.‖字符是指当前目录的一个相对路径.

常用正则表达式

1. 平时做网站经常要用正则表达式,下面是一些讲解和例子,仅供大家参考和修改使用: 2. "^\d+$"//非负整数(正整数+ 0) 3. "^[0-9]*[1-9][0-9]*$"//正整数 4. "^((-\d+)|(0+))$"//非正整数(负整数+ 0) 5. "^-[0-9]*[1-9][0-9]*$"//负整数 6. "^-?\d+$"//整数 7. "^\d+(\.\d+)?$"//非负浮点数(正浮点数+ 0) 8. "^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$"//正浮点数 9. "^((-\d+(\.\d+)?)|(0+(\.0+)?))$"//非正浮点数(负浮点数+ 0) 10. "^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"//负浮点数 11. "^(-?\d+)(\.\d+)?$"//浮点数 12. "^[A-Za-z]+$"//由26个英文字母组成的字符串 13. "^[A-Z]+$"//由26个英文字母的大写组成的字符串 14. "^[a-z]+$"//由26个英文字母的小写组成的字符串 15. "^[A-Za-z0-9]+$"//由数字和26个英文字母组成的字符串 16. "^\w+$"//由数字、26个英文字母或者下划线组成的字符串 17. "^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$"//email地址 18. "^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$"//url 19. /^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/ // 年-月-日 20. /^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/ // 月/日/年 21. "^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$" //Emil 22. /^((\+?[0-9]{2,4}\-[0-9]{3,4}\-)|([0-9]{3,4}\-))?([0-9]{7,8})(\-[0-9]+)?$/ //电话号码 23. "^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}| 1dd|2[0-4]d|25[0-5])$" //IP地址 24. 25. 匹配中文字符的正则表达式:[\u4e00-\u9fa5] 26. 匹配双字节字符(包括汉字在内):[^\x00-\xff] 27. 匹配空行的正则表达式:\n[\s| ]*\r 28. 匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/ 29. 匹配首尾空格的正则表达式:(^\s*)|(\s*$) 30. 匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* 31. 匹配网址URL的正则表达式:^[a-zA-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\S*)?$ 32. 匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 33. 匹配国内电话号码:(\d{3}-|\d{4}-)?(\d{8}|\d{7})? 34. 匹配腾讯QQ号:^[1-9]*[1-9][0-9]*$ 35. 36. 37. 元字符及其在正则表达式上下文中的行为:

Python基础入门教程

Python基础入门教程 你可能已经听说过很多种流行编程语言,比如非常难学的C语言,非常流行的Java语言,适合初学者的Basic语言,适合网页编程的JavaScript语言,那么你知道Python是一种怎样的计算机程序设计语言吗?下面应广大读者需求,给大家呈上一篇Python基础入门教程的文章。 Python 是由Guido van Rossum 在八十年代末和九十年代初,在荷兰国家数学和计算机科学研究所设计出来的。 Python 本身也是由诸多其他语言发展而来的,这包括ABC、Modula-3、C、C++、Algol-68、SmallTalk、Unix shell 和其他的脚本语言等等。 像Perl 语言一样,Python 源代码同样遵循GPL(GNU General Public License)协议。 现在Python 是由一个核心开发团队在维护,Guido van Rossum 仍然占据着至关重要的作用,指导其进展。 Python 特点

? 1.易于学习:Python有相对较少的关键字,结构简单,和一个明确定义的语法,学习起来更加简单。 ? 2.易于阅读:Python代码定义的更清晰。 ? 3.易于维护:Python的成功在于它的源代码是相当容易维护的。 ? 4.一个广泛的标准库:Python的最大的优势之一是丰富的库,跨平台的,在UNIX,Windows和Macintosh兼容很好。 ? 5.互动模式:互动模式的支持,您可以从终端输入执行代码并获得结果的语言,互动的测试和调试代码片断。 ? 6.可移植:基于其开放源代码的特性,Python已经被移植(也就是使其工作)到许多平台。 ?7.可扩展:如果你需要一段运行很快的关键代码,或者是想要编写一些不愿开放的算法,你可以使用C或C++完成那部分程序,然后从你的Python程序中调用。 ?8.数据库:Python提供所有主要的商业数据库的接口。 ?9.GUI编程:Python支持GUI可以创建和移植到许多系统调用。 ?10.可嵌入: 你可以将Python嵌入到C/C++程序,让你的程序的用户获得"脚本化"的能力。

正则表达式介绍和例子分析

含义:编写字符串处理的程序或网页时,会有查找符合某复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。它是记录文本规则的代码。 元字符 用来代替字符的符号 表1.常用的元字符 代码说明 .匹配除换行符以外的任意字符 \w匹配字母或数字或下划线或汉字 \s匹配任意的空白符 \d匹配数字 注:\s匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等正则表达式中的空格会当成空格匹配。(输入几个空格就匹配几个) 非打印字符

限定符 重复:表现重复时用的是大括号{}和* + ,表示范围时用的是中括号[],中括号里面是只选其中一个的组合。表达分组时用圆括号(),一个圆括号表示一个意思。 表2.常用的限定符 代码/语法说明 *重复零次或更多次 +重复一次或更多次 重复零次或一次 {n}重复n次 {n,}重复n次或更多次 {n,m}重复n到m次 字符类[],用来表示取字符的范围区间,用中括号括起来 [0-9]代表\d [a-z0-9A-Z]表示\w 分支条件,用|表示或者的关系。 贪婪与懒惰、最先开始匹配拥有最高优先权 *、+和限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个就可以实现非贪婪或最小匹配。 .*表示尽可能匹配多的字符 .*表示尽可能少的字符 例如:字符串aabab,用贪婪匹配a.*b得到aabab,用懒惰匹配a.*b得到aab和ab

定位符 定位符使您能够将正则表达式固定到行首或行尾。它们还使您能够创建这样的正则表达式,这些正则表达 式出现在一个单词内、在一个单词的开头或者一个单词的结尾。 定位符用来描述字符串或单词的边界,^和$分别指字符串的开始与结束,\b描述单词的前或后边界,\B表 示非单词边界。 正则表达式的限定符有: 字符描述 ^匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与 \n 或 \r 之后匹配。 $匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与 \n 或 \r 之前匹配。 \b匹配一个字边界,即字与空格间的位置。 \B非字边界匹配。 子表达式分组获取() 分组,用()把子表达式括起来,给一个组号,后面可以再用 后向引用,用()定义的分组,可以给它定一个组名,在后面加以利用。 用(\w+)或者(’Word’\w+)定义\w+组名为Word,利用方式为\k

python学习笔记(一)

python学习笔记(一) 安装 下载python安装包:https://https://www.sodocs.net/doc/2f3669190.html,/downloads/ 找到你的下载位置,双击安装

安装成功后,在开始菜单中就会多出几个图标。好了安装完毕可以开始使用了。 IDLE 是Python 的图形用户界面(GUI );Python 是Python 的命令提示符界面(command line )。它两都是和Python 解释器交互的手段。Module Docs 是模块手册,意思是Python 各种模块的说明书。 现在我们使用Python 3.9(64-bit)即命令提示符界面试一下! 输入:print(“Hello,World!”)回车,输入出结果“Hello ,World !” 当然我们最好使用GUI 界面。 这两外界面都是我们Python 交互解释器,也是我们用来执行语句的界面。

基本常识 1、数字和表达式 Python解释器可以当成一个很强大的计算器。下面我们来试一下! >>> 412+845 1257 >>> 12310-54131 -41821 >>> 1454*1321 1920734 >>> 87/84 1.0357142857142858 >>> >>> 4//3 1 >>> 1%2 1 >>> 4^2 6 >>>

值得注意的是: 长整型:对于大于2 147 483 647(231)就必须在数字后面加上“L”表示长整型数。2进制数:前面加0b(如0b1111就是二进制中的1111) 8进制数:前面加0o(如010就是八进制中的10)。 16进制数:前面加0x(如0xAF就是十六进制中的AF)。 >>> 0o10 8 >>> 0b1111 15 >>> 0o10 8 >>> 0xffff 65535 >>> 2、程序的结构

python基础教程-函数

函数 哈尔滨工业大学计算机学院 叶麟

函数是什么主要内容 1 函数定义与调用2 函数参数与返回值3 变量作用域4 函数优缺点 5

求1 to 10, 20 to 37, 35 to 49的和sum = 0 for i in range(1, 11): sum += i print("Sum from 1 to 10 is", sum) sum = 0 for i in range(20, 38): sum += i print("Sum from 20 to 37 is", sum) sum = 0 for i in range(35, 50): sum += i print("Sum from 35 to 49 is", sum)

def sum(i1, i2): result = 0 for i in range(i1, i2 + 1): result += i return result def main(): print("Sum from 1 to 10 is", sum(1, 10)) print("Sum from 20 to 37 is", sum(20, 37)) print("Sum from 35 to 49 is", sum(35, 49)) main() # Call the main function

收件人信息:姓名,地址,电话 发件人信息:姓名,地址,电话 物品,邮费 快递单 顺丰客户服务中心 接件地址顺丰快递员

函数 ?完成特定功能的一个语句组,这组语句可以作为 一个单位使用,并且给它取一个名字 ?通过函数名执行 f(x) = x2–2x + 1

正则表达式介绍和例子

正则表达式 含义:编写字符串处理的程序或网页时,会有查找符合某复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。它是记录文本规则的代 码。 元字符 用来代替字符的符号 注:\s匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等 正则表达式中的空格会当成空格匹配。(输入几个空格就匹配几个) 非打印字符 非打印字符也可以是正则表达式的组成部分。下表列出了表示非打印字符的转义序列: 字符描述 \cx 匹配由x指明的控制字符。例如,\cM匹配一个Control-M 或回车符。x 的值必须为A-Z 或a-z 之则,将 c 视为一个原义的'c' 字符。 \f 匹配一个换页符。等价于\x0c 和\cL。 \n 匹配一个换行符。等价于\x0a 和\cJ。 \r 匹配一个回车符。等价于\x0d 和\cM。 \s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

限定符 重复:表现重复时用的是大括号{}和* + ?,表示范围时用的是中括号[],中括号里面是只选其中一个的组合。表达分组时用圆括号(),一个圆括号表示一个意思。 ●字符类[],用来表示取字符的范围区间,用中括号括起来 [0-9]代表\d [a-z0-9A-Z]表示\w ●分支条件,用|表示或者的关系。 ●贪婪与懒惰、最先开始匹配拥有最高优先权 *、+和?限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个?就可以实现非贪婪或最小匹配。 .*表示尽可能匹配多的字符 .*?表示尽可能少的字符 例如:字符串aabab,用贪婪匹配a.*b得到aabab,用懒惰匹配a.*?b得到

Python与Java对比学习笔记

零基础学Python 第一天 Python简介 Python是一种面向对象、直译式计算机程序设计语言,这种语言的语法简捷而清晰,并且具有丰富和强大的类库。Python在执行时,首先会将.py文件中的源代码编译成Python的byte code(字节码),然后再由Python Virtual Machine来执行这些编译好的byte code。这种机制的基本思想跟Java,.NET是一致的。然而,Python Virtual Machine与Java或.NET 的Virtual Machine不同的是,Python的Virtual Machine是一种更高级的Virtual Machine。这里的高级并不是通常意义上的高级,不是说Python的Virtual Machine比Java或.NET 的功能更强大,而是说和Java 或.NET相比,Python的Virtual Machine距离真实机器的距离更远。或者可以这么说,Python的Virtual Machine是一种抽象层次更高的Virtual Machine。目前稳定的版本是3.3,当时目前使用者还不是很多。我们学习中用到的是2.7。 Python优点 简单:Python是一种代表简单主义思想的语言。阅读一个良好的Python程序就感觉像是在读英语一样。它使你能够专注于解决问题而不是去搞明白语言本身。 易学:Python极其容易上手,因为Python有极其简单的语法。 免费、开源:Python是FLOSS(自由/开放源码软件)之一。使用者可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自由软件中。FLOSS 是基于一个团体分享知识的概念。 高层语言:用Python语言编写程序的时候无需考虑诸如如何管理你的程序使用的内存一类的底层细节。 可移植性:由于它的开源本质,Python已经被移植在许多平台上(经过改动使它能够工作在不同平台上)。这些平台包括Linux、Windows、FreeBSD、Macintosh、Solaris、OS/2、Amiga、AROS、AS/400、BeOS、OS/390、z/OS、Palm OS、QNX、VMS、Psion、Acom RISC OS、VxWorks、PlayStation、Sharp Zaurus、Windows CE、PocketPC、Symbian 以及Google基于linux开发的android平台。 解释性:一个用编译性语言比如C或C++写的程序可以从源文件(即C或C++语言)转换到一个你的计算机使用的语言(二进制代码,即0和1)。这个过程通过编译器和不同的标记、选项完成。 运行程序的时候,连接/转载器软件把你的程序从硬盘复制到内存中并且运行。而Python 语言写的程序不需要编译成二进制代码。你可以直接从源代码运行程序。 在计算机内部,Python解释器把源代码转换成称为字节码的中间形式,然后再把它翻译成计算机使用的机器语言并运行。这使得使用Python更加简单。也使得Python程序更加易于移植。

python爬虫入门到实战的学习顺序

https://www.sodocs.net/doc/2f3669190.html, python爬虫入门到实战的学习顺序 Python是一种常见的爬虫语言,可以抓取网络的大部分数据。比如证券交易数据、天气数据、网站用户数据等等,另外python内含很多用来做数据分析的包,拿到这些数据之后你就可以做详细的数据分析工作。正是因为python如此强大,所以越来越多的朋友开始学习python爬虫,下面为大家介绍python爬虫如何入门。 一、Python基础学习。 首先,我们要用Python写爬虫,肯定要了解Python的基础。下面推荐知乎用户Crossin的python自学方法: 关于自学python,个人最大的3点经验: 1、找一本浅显易懂,例程比较好的教程,从头到尾看下去。不要看很多本,专注于一本。把里面的例程都手打一遍,搞懂为什么。我当时看的是《简明python 教程》,不过这本书不是非常适合零基础初学者。零基础推荐《与孩子一起学编程》,或者看我写的教程Crossin的编程教室-Python入门。 2、去找一个实际项目练手。我当时是因为要做一个网站,不得已要学python。这种条件下的效果比你平时学一门新语言要好很多。所以最好是要有真实的项目做。可以找几个同学一起做个网站之类。注意,真实项目不一定非要是商业项目,你写一个只是自己会用的博客网站也是真实项目,关键是要核心功能完整。 3、最好能找到一个已经会python的人。问他一点学习规划的建议(上知乎也是个途径),然后在遇到卡壳的地方找他指点。这样会事半功倍。但是,要学会搜索,学会如何更好地提问。没人愿意帮你写作业或是回答“一搜便知”的问题。 所以除了前面说的3点经验,给初学编程者的额外建议: 1、首先要有信心。虽然可能你看了几个小时也没在屏幕上打出一个三角形,或者压根儿就没能把程序运行起来。但相信我,几乎所有程序员一开始都是这么折腾过来的。

相关主题