Nếu bạn đã quen thuộc với sức mạnh cơ bản của các cụm từ thông dụng, bạn có thể quan tâm đến việc biết cách chúng có thể được sử dụng như thế nào. Nếu bạn muốn tìm hiểu các khái niệm cơ bản, hãy xem bảng tính Regular Expressions của chúng tôi và Hướng dẫn cho người mới tham gia Biểu thức chính quy. Dưới đây là một số công việc hàng ngày, nơi biểu thức chính quy có thể cải thiện năng suất của bạn.

1. Đổi tên tệp với các quy tắc phức tạp

Bất kỳ người dùng máy tính hiểu biết nào cũng có thể xử lý đổi tên một đống tệp bằng một chuỗi văn bản đơn giản và tăng lượt truy cập. Tuy nhiên, khó hơn, để đổi tên các tệp theo một giao thức nhất định. Giả sử bạn muốn đổi tên tệp dựa trên tên tệp hiện tại, thư mục hiện tại, ngày sửa đổi hoặc một số thuộc tính khác. Cụm từ thông dụng có thể giúp chỉ định cẩn thận những tệp nào cần đổi tên và sau đó đổi tên chúng với các quy tắc phức tạp. Nếu bạn có hàng ngàn tệp để đổi tên theo một số hướng dẫn, điều này là vô giá.

Bạn có thể cuộn tập lệnh của riêng bạn cho chức năng này bằng bất kỳ ngôn ngữ nào hỗ trợ các cụm từ thông dụng, như Python hoặc Perl, nhưng cũng có sẵn các tùy chọn phần mềm. Kiểm tra Trình tìm kiếm tốt hơn Đổi tên trên macOS, ReNamer trên Windows hoặc Métamorphose trên Linux.

2. Tìm kiếm bảng tính cho dữ liệu được định dạng

Nếu bạn đã từng cuộn qua một bảng tính tìm kiếm tất cả dữ liệu được định dạng như mã ZIP, các biểu thức chính quy sẽ là một người bạn nhanh. Các biểu thức chính quy tồn tại để giải quyết chính xác loại sự cố đó, trả về dữ liệu được định dạng theo một cách nhất định. Ví dụ: nếu bạn muốn tìm mã ZIP Hoa Kỳ hợp lệ trong cả ba định dạng phổ biến, bạn có thể sử dụng cụm từ thông dụng như sau:

 ^ \ d {5} (?: [- \ s] \ d {4})? $ 

Hãy chia nhỏ một chút:

  • ^ cho biết bắt đầu chuỗi
  • \d{5} khớp năm chữ số
  • (?: bắt đầu một nhóm
  • [-\s] khớp với một khoảng trống hoặc dấu gạch ngang
  • \d{4} khớp với bốn chữ số cuối cùng
  • )? cho biết nhóm trước là tùy chọn
  • $ kết thúc chuỗi

Biểu thức này sẽ khớp với các mã ZIP gồm năm chữ số cũng như mã ZIP có vòng loại bốn chữ số tùy chọn, có và không có dấu gạch ngang.

Các chương trình bảng tính phổ biến như Excel không hỗ trợ các biểu thức chính quy ngay lập tức. Bạn sẽ cần sử dụng một VBScript nhỏ hoặc viết một chương trình Python đơn giản để thu thập dữ liệu thông qua dữ liệu của bạn. Nếu bạn đã sẵn sàng với mã, bạn không nên tìm thấy nhiệm vụ này quá áp đảo.

3. Tìm kiếm và thay thế nâng cao

Một số ứng dụng đáng ngạc nhiên cung cấp hỗ trợ cho việc tìm kiếm và thay thế văn bản bằng các cụm từ thông dụng. InDesign của Adobe cung cấp hỗ trợ cho các biểu thức chính quy, cũng như Word. Mỗi động cơ đều có những điều kiện thực hiện riêng, và không thể gọi là hoàn thành, nhưng họ sẽ hoàn thành công việc. Trong Word bạn có thể sử dụng điều này để sắp xếp lại định dạng cho các ngày được viết hoặc thêm dấu chấm vào các từ viết tắt. Nếu bạn cần nhiều quyền lực hơn, bạn có thể sử dụng công cụ của bên thứ ba như PowerGREP để tìm kiếm nhiều tài liệu văn bản khác nhau bằng công cụ RegEx đầy đủ tính năng dựa trên Perl.

4. Tìm kiếm tệp theo nội dung

grep có thể là một trong những công cụ mạnh mẽ và không được tận dụng tối đa trên các nền tảng có hương vị UNIX. Tiện ích dòng lệnh này hỗ trợ các biểu thức chính quy theo mặc định, cho phép bạn tìm kiếm nội dung của các tệp với một mẫu biểu thức chính quy. Nó không phải lúc nào cũng hoạt động đáng tin cậy với các tập tin văn bản phong phú, nhưng đối với văn bản thuần túy, dữ liệu và bảng tính, nó là vô giá.

Trên macOS hoặc Linux bạn có sẵn quyền truy cập vào grep thông qua dòng lệnh. Nếu bạn đang sử dụng Windows, bạn có thể sử dụng PowerGREP nói trên để tìm kiếm tệp theo nội dung mà không cần thay thế bất kỳ thứ gì.

Phần kết luận

Khi bạn quen với việc sử dụng cụm từ thông dụng, bạn có quyền truy cập vào một công cụ vô cùng mạnh mẽ. Bất cứ lúc nào bạn đang tìm kiếm một cái gì đó trực quan, dừng lại một lúc và xem xét liệu bạn có thể viết một RegEx nhanh để làm điều tương tự cho bạn hay không. Ngay cả khi bạn không phải là một lập trình viên, bạn có thể nhận được rất nhiều sử dụng trong số các biểu thức thông thường.

Hình ảnh tín dụng: Tìm và thay thế, Grep-tutorial-05