01/10/2018, 11:54

8 - Định dạng chuỗi trong Python

#Định dạng bằng toán tử %

Kiểu định dạng này sẽ là rất quen thuộc nếu bạn từng tiếp xúc với ngôn ngữ lập trình C. Hãy đến với một số ví dụ

>>> 'My name is %s.' % ('Lucario')
'My name is Lucario'
>>> '%d. That is %s problem.' % (1, 'That')
'1. That is the problem.'

Lưu ý: Không hề có dấu , tách phần chuỗi và phần giá trị cần định dạng
Để hiểu rõ hơn cách hoạt động của cách định dạng này, mời các bạn xem hình sau

Với hình vẽ trên, bạn có thể dễ dàng biết được cách mà nó hoạt động. Đó là từng phần kí hiệu %s sẽ lần lượt được thay thế lần lượt bởi các giá trị nằm trong cặp dấu ngoặc đơn (Đây là kiểu dữ liệu Tuple).
Thêm một số ví dụ minh họa

>>> s = '%s %s'
>>> s % ('one', 'two')
'one two'
>>> s % ('a', 'b')
'a b'
>>> c = s % ('c', 'cc')
>>> c
'c cc'
>>> s % ('D')  # không được, vì trong chuỗi của biến d có dư kí hiệu % để thay thế
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: not enough arguments for format string
>>> d % ('a', 'b') # không thể, vì trong chuỗi của biến d không có đủ kí hiệu % để thay thế
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: not all arguments converted during string formatting

Dưới đây là một số các toán tử % cơ bản trong Python

+---------+---------------------------------------------------+
|    Toán tử   |              Giải thích                                                                           |
+---------+---------------------------------------------------+
|        %s       | Giá trị của phương thức __str__ của đối tượng đó                      |
+---------+---------------------------------------------------+
|        %r       | Giá trị của phương thức __repr__ của đối tượng đó                    |
+---------+---------------------------------------------------+
|        %d      | Giá trị của một số - Nếu là số thực thì sẽ chỉ lấy phần nguyên     |
|                   |                             (chuyển sang số nguyên)                                    |
+---------+---------------------------------------------------+
|    %.<n>f    | Giá trị của một số - Nếu là số sẽ được chuyển sang số thực        |
+---------+---------------------------------------------------+

Có thể bạn sẽ cảm thấy khó hiểu ở hai toán tử %s và %r. Mọi thứ trong Python đều là các đối tượng của một lớp nào đó. Do đó nó đều có các phương thước, thuộc tính riêng. Các đối tượng trong Python luôn luôn có hai phương thức đó là __str____repr__. Tuy các bạn chưa tiếp xúc với hướng đối tượng bao giờ để hiểu được khái niệm này. Nhưng mình sẽ viết một lớp đơn giản để giải thích cho bạn hiểu sự khác biệt giữa %r và %s.

>>> class SomeThing:
…         def __repr__(self):
…                 return 'Đây là __repr__'
…         def __str__(self):
…              return 'Đây là __str__'
…
>>> 

Vừa rồi, mình đã tạo một lớp với tên là SomeThing, giờ mình sẽ tạo một đối tượng thuộc lớp đó

>>> sthing = SomeThing()

Đừng vội bối rối, thật ra nó cũng là một giá trị bình thường thôi. Cũng giống như một chuỗi, một con số.

>>> type(sthing)  # và nó thuộc lớp SomeThing
<class '__main__.SomeThing'>

Và giờ, hãy xem giá trị của đối tượng sthing nhé

>>> sthing
Đây là __repr__
>>> print(sthing)
Đây là __str__

Nó có sự khác biệt. Và giờ, ta sẽ thấy sự khác biệt giữa %s và %r

>>> '%r' % (sthing)
'Đây là __repr__'
>>> '%s' % (sthing)
'Đây là __str__'

%s thay thế cho giá trị của phương thức __str__ tạo nên đối tượng đó. Còn về %r thì là phương thức __repr__. Do đó, bạn có thể sử dụng %s hoặc %r với mọi đối tượng trong Python.

>>> '%s' % (1)  # số
'1'
>>> '%r' % (1)
'1'
>>> '%s' % ([1, 2, 3])  # kiểu dữ liệu list
'[1, 2, 3]'
>>> '%r' % ([1, 2, 3])
'[1, 2, 3]'
>>> '%s' % ((1, 2, 3)) # kiểu dữ liệu tuple
'(1, 2, 3)'
>>> '%r' % ((1, 2, 3))
'(1, 2, 3)'

Ở kí hiệu %d, nó đơn giản dễ hiểu hơn với hai kí hiệu ta vừa biết qua ở trên. Kí hiệu này chỉ thay thế cho một số.

>>> '%d' %(3)
'3'
>>> '%d' % ('3')  # lỗi, vì '3' không phải 3
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: %d format: a number is required, not str
>>> '%d' % (3.9)  # chỉ lấy phần nguyên
'3'
>>> '%d' % (10/3)
'3'

Như bạn thấy, %d không phù hợp cho số thực, đó là lí do ta có %f

>>> '%f' % (3.9)
'3.900000'
>>> '%f' % ('a')  # %f cũng yêu cầu một số, ngoài ra đều là lỗi
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: must be real number, not str
>>> '%f' % (3)
'3.000000'
>>> '%.2f' % (3.563545)  # chỉ lấy 2 số ở phần thập phân
'3.56'
>>> '%.3f' % (3.9999) # %f cũng có khả năng làm tròn
'4.000'

#NEXT
9 - ĐỊNH DẠNG CHUỖI TRONG PYTHON (PHẦN 2)
#PREVIOUS
7 - KIỂU DỮ LIỆU(LỚP) CHUỖI TRONG PYTHON

Bài liên quan
0