LeetCode 8. 字符串转换整数 (atoi)
题目:
请你来实现一个 atoi 函数,使其能将字符串转换成整数。
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。
在任何情况下,若函数不能进行有效的转换时,请返回 0 。
提示:
本题中的空白字符只包括空格字符 ' ' 。
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−231, 231 − 1]。如果数值超过这个范围,请返回 INT_MAX (231 − 1) 或 INT_MIN (−231) 。
示例 1:
输入: "42"
输出: 42
示例 2:
输入: " -42"
输出: -42
解释: 第一个非空白字符为 '-', 它是一个负号。
我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。
示例 3:
输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。
示例 4:
输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号。
因此无法执行有效的转换。
示例 5:
输入: "-91283472332"
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围。
因此返回 INT_MIN (−231) 。
思路:
这题目限制条件很多,一一对应实现判断即可,有个地方,假如字串是:' 1 23'-->输出是1,也就是说,我们不能对整个字符去除空格,只能去除首位,中间任意空格后面的整数都默认为无效。
方法一:
下面是笨方法,题目有什么限制条件就加什么,我也不知道我加了多少次,😂。 不过我被莫名其妙的越界困扰了好几次(前面明明有做return 处理,依旧报错),无奈把条件都写死,让所有情况都写在一个判断里,这样就不会再报错了,不知道它是怎么判定的。
class Solution(object):
def myAtoi(self, str):
"""
:type str: str
:rtype: int
"""
str = str.lstrip() #去除空格
s = ''
flag = False #负号状态位
length = len(str)
if len(str) !=0:
if str[0] == '-' and length != 1 :
str = str[1:] #去除负号,更新str
flag = True
if str[0] == '+' and length != 1 :
if flag: #+-这样的特殊情况要return 0
return 0
else:
str = str[1:] #去除正号,更新str
if str[0].isdigit(): #判断更新后的str 是否为数字
for st in str: #判断接下来的str内容是否为数字,否则跳出
if st.isdigit():
s +=st
else:
break
else:#不是,return 0
return 0
else: #判断长度,为0则return 0(有把这些首字特殊情况写到最开始return处理,但是会报错,加进if判断里面就不会报错了)
return 0
if flag: #为负数
if str[0] =='+': # -+ return 0应该写在前面,不过为了区分理解整个流程,写到后面了。
return 0
a= -(int(s))
return a if -2**31 <= a <= 2**31 - 1 else -2**31 #越界
else:
if str[0] =='-': #为正数,但是包含-,return 0
return 0
a= int(s)
return a if -2**31 <= a <= 2**31 - 1 else 2**31 -1 #越界
执行用时 :44 ms, 在所有 Python 提交中击败了30.93%的用户
内存消耗 :12.9 MB, 在所有 Python 提交中击败了16.67%的用户
方法二:
方法一是我写的渣渣if 判断.....下面来一个大神的正则处理,一行搞定,不服不行。
'''
^:匹配字符串开头
[\+\-]:代表一个+字符或-字符
?:前面一个字符可有可无
\d:一个数字
+:前面一个字符的一个或多个
\D:一个非数字字符
*:前面一个字符的0个或多个
'''
import re
class Solution(object):
def myAtoi(self, str):
"""
:type str: str
:rtype: int
"""
return max(min(int(*re.findall('^[\+\-]?\d+', str.lstrip())), 2**31 - 1), -2**31)
执行用时 :24 ms, 在所有 Python 提交中击败了95.28%的用户
内存消耗 :12.8 MB, 在所有 Python 提交中击败了16.67%的用户
正则拆解一下,方便理解。
import re
class Solution(object):
def myAtoi(self, str) :
INT_MAX = 2**31 - 1
INT_MIN = -2**31
str = str.lstrip() #清除左边多余的空格
num_re = re.compile(r'^[\+\-]?\d+') #设置正则规则
num = num_re.findall(str) #查找匹配的内容
#num = re.findall('^[+-]?\d+',str) 也可以合并
num = int(*num) #由于返回的是个列表,解包并且转换成整数,*是解包作用
return max(min(num,INT_MAX),INT_MIN) #返回值
解包知识get:https://zhuanlan.zhihu.com/p/41968260
方法三:
参考官方解答,这题目的思想是依靠检查状态机来确定内容。
题目条件就相当于有一个状态 s,每次从序列中输入一个字符 c,并根据字符 c 转移到下一个状态 s'。这样,我们只需要建立一个覆盖所有情况的从 s 与 c 映射到 s' 的表格即可解决题目中的问题。
状态表格如下:
我们只需要按照表格所述的状态,进行代码转换筛选即可。 记得保存当前输出数字,因为符合条件的number 需要累加更新。
INT_MAX = 2 ** 31 - 1
INT_MIN = -2 ** 31
class Automaton:
def __init__(self):
self.state = 'start'
self.sign = 1
self.ans = 0
self.table = {
'start': ['start', 'signed', 'in_number', 'end'],
'signed': ['end', 'end', 'in_number', 'end'],
'in_number': ['end', 'end', 'in_number', 'end'],
'end': ['end', 'end', 'end', 'end'],
}
def get_col(self, c):
if c.isspace():
return 0
if c == '+' or c == '-':
return 1
if c.isdigit():
return 2
return 3
def get(self, c):
self.state = self.table[self.state][self.get_col(c)]
if self.state == 'in_number':
self.ans = self.ans * 10 + int(c)
self.ans = min(self.ans, INT_MAX) if self.sign == 1 else min(self.ans, -INT_MIN)
elif self.state == 'signed':
self.sign = 1 if c == '+' else -1
class Solution:
def myAtoi(self, str):
automaton = Automaton()
for c in str:
automaton.get(c)
return automaton.sign * automaton.ans