01/10/2018, 11:19

Tìm thư viện xử lý string trong python

Em học không đi sâu vào python nên những cái cơ bản này không nắm được bởi vậy trong quá trình làm việc rất khó chịu khi xử lý những tiểu tiết nhỏ ở string.

Em muốn nhờ các bác gợi ý cho em 1 cái thư viện xử lý string có đầy đủ chức năng và cả hướng dẫn (được hướng dẫn bằng ví dụ là tốt nhất)

Thanks các bác!

HK boy viết 13:29 ngày 01/10/2018

Xử lí string tốt?

  • Kĩ năng đọc hiểu string tốt: hiểu string của mình có cái gì. Ví dụ như string
Dialogue: 0,0:02:00.00,0:02:05.00,Info,,0,0,0,,俾面派對\N\N作曲: 黃家駒\N作詞: 黃貫中
# các bác thông cảm, vừa xử lí xong file đến ~2000 dòng có xâu kiểu dạng như thế này,
# tiện thì up luôn cho thớt theo dõi

có kết cấu như thế nào, có những kí tự nào đặc biệt, có những thông tin gì cần xử lí.

  • Đọc các tut cơ bản về string trong Python, có các hàm cơ bản phải nhớ, như strip, replace, find, rfind,... (đó là tất cả những gì mình nhớ ra).
  • Biết 1 chút về unicode, encode, decode.
  • Biết dùng regex (Regular Expression)
Hà Temwin viết 13:22 ngày 01/10/2018

Ví dụ như hiện tại em muốn tìm hàm loại bỏ các dấu cách thừa trong chuỗi.
Giống hàm trim() trong PHP.
Bác gợi ý giúp em phát

HK boy viết 13:25 ngày 01/10/2018

muốn tìm hàm loại bỏ các dấu cách thừa trong chuỗi.

stackoverflow.com
TIMEX

Simple way to remove multiple spaces in a string?

python, regex, string
asked by TIMEX on 09:48PM - 09 Oct 09
Henry viết 13:26 ngày 01/10/2018

Python nó tuyệt vời lắm, vô số các hàm, phương thức xử lí, bạn cũng có thể tự làm được.
Với ví dụ này bên PHP

<?php
$str = "Hello World!";
echo $str . "<br>";
echo trim($str,"Hed!");
?>

Thì bạn có thể viết bên Python

str = 'Hello World!'
print(str.strip('Hed!'))

Cái điểm yếu chỉ là bạn code chưa đủ nhiều, biết ít API của Python nên bạn thấy rối thôi

Hung viết 13:22 ngày 01/10/2018

Nên lướt qua hết tất cả API một lần, không cần nhớ. Sau này làm tới phần nào thì biết nên search trên module nào.
https://docs.python.org/3/library/index.html

Bài liên quan
0