Truyền block vào trong Ruby mà không thông qua cách &block
Chú thích : Bản dịch tiếng Việt của bài viết Passing Blocks in Ruby Without &block của Paul Mucur Có 2 cách để nhận vào block trong một hàm của Ruby. Cách đầu tiên là sử dụng từ khoá yield như sau: def speak puts yield end speak { "Hello" } # Hello # => nil Cách khác là chèn ...
Chú thích: Bản dịch tiếng Việt của bài viết Passing Blocks in Ruby Without &block của Paul Mucur
Có 2 cách để nhận vào block trong một hàm của Ruby. Cách đầu tiên là sử dụng từ khoá yield như sau:
def speak
puts yield
end
speak { "Hello" }
# Hello
# => nil
Cách khác là chèn vào trước argument cuối của một hàm với một dấu & (ampersand) để sau đó tạo ra một đối tượng Proc từ bất kể block nào được truyền vào. Đối tượng này có thể được thực thi với hàm call như sau:
def speak(&block)
puts block.call
end
speak { "Hello" }
# Hello
# => nil
Vấn đề của cách thứ 2 là khi khởi tạo đối tượng Proc mới sẽ làm ảnh hưởng đến tốc độ, anh Aaron Patterson có giải thích chi tiết trong bài nói “ZOMG WHY IS THIS CODE SO SLOW?” tại RubyConf X, (đoạn 30 phút hay ở trang
).Chúng ta có thể kiểm tra thông qua benchmark, block_benchmark.rb:
require "benchmark"
def speak_with_block(&block)
block.call
end
def speak_with_yield
yield
end
n = 1_000_000
Benchmark.bmbm do |x|
x.report("&block") do
n.times { speak_with_block { "ook" } }
end
x.report("yield") do
n.times { speak_with_yield { "ook" } }
end
end
Kết quả cho thấy sự khác biệt rõ rệt giữa 2 cách:
$ ruby block_benchmark.rb
Rehearsal ------------------------------------------
&block 1.410000 0.020000 1.430000 ( 1.430050)
yield 0.290000 0.000000 0.290000 ( 0.291750)
--------------------------------- total: 1.720000sec
user system total real
&block 1.420000 0.030000 1.450000 ( 1.452686)
yield 0.290000 0.000000 0.290000 ( 0.292179)
Điều đó chứng ta là chúng ta nên chọn yield thay vi &block, nhưng nếu chúng ta cần truyền một block qua một hàm khác thì sao?
Ví dụ, ở đây là một class với một hàm tell_ape giao việc cho một hàm khác có tên tell. Kiểu pattern thường được xử lý bằng method_missing nhưng tôi sẽ giữ và khai báo toàn bộ các hàm để dễ dàng giải thích:
class Monkey
# Monkey.tell_ape { "ook!" }
# ape: ook!
# => nil
def self.tell_ape(&block)
tell("ape", &block)
end
def self.tell(name, &block)
puts "#{name}: #{block.call}"
end
end
Đấy là một điều không thể làm với từ khoá yield:
class Monkey
# Monkey.tell_ape { "ook!" }
# ArgumentError: wrong number of arguments (2 for 1)
def self.tell_ape
tell("ape", yield)
end
def self.tell(name)
puts "#{name}: #{yield}"
end
end
và cũng không thể chạy với cách &block:
class Monkey
# Monkey.tell_ape { "ook!" }
# TypeError: wrong argument type String (expected Proc)
def self.tell_ape
tell("ape", &yield)
end
def self.tell(name)
puts "#{name}: #{yield}"
end
end
Nhưng có một cách để tạo một đối tượng Proc khi cần thiết, đó là cách sử dụng một đặc tính ít được biết đến của hàm Proc.new, anh Aaron có giải thích trong bài nói được nhắc ở trên.
Nếu Proc.new được gọi từ bên trong một hàm với không có argument nào của chính
nó, nó sẽ trả về một Proc có kèm block được đưa cho hàm ở ngoài.
def speak
puts Proc.new.call
end
speak { "Hello" }
# Hello
# => nil
Điều này có nghĩa là có thể truyền vào một block giữa các hàm với nhau mà không cần phải sử dụng &block nữa:
class Monkey
# Monkey.tell_ape { "ook!" }
# ape: ook!
# => nil
def self.tell_ape
tell("ape", &Proc.new)
end
def self.tell(name)
puts "#{name}: #{yield}"
end
end
Dĩ nhiên là nếu bạn dùng Proc.new, bạn sẽ bị mất tốc độ của cách yield (khi các đối tượng Proc được khởi tạo với &block) nhưng nó sẽ tránh được các khởi tạo không cần thiết của các đối tượng Proc khi bạn không cần đến chúng. Tôi có thể chứng thực điều vừa nói thông qua benchmark proc_new_benchmark.rb:
require "benchmark"
def sometimes_block(flag, &block)
if flag && block
block.call
end
end
def sometimes_proc_new(flag)
if flag && block_given?
Proc.new.call
end
end
n = 1_000_000
Benchmark.bmbm do |x|
x.report("&block") do
n.times do
sometimes_block(false) { "won't get used" }
end
end
x.report("Proc.new") do
n.times do
sometimes_proc_new(false) { "won't get used" }
end
end
end
Kết quả là khác biệt rất lớn về tốc độ:
$ ruby code/proc_new_benchmark.rb
Rehearsal --------------------------------------------
&block 1.080000 0.160000 1.240000 ( 1.237644)
Proc.new 0.160000 0.000000 0.160000 ( 0.156077)
----------------------------------- total: 1.400000sec
user system total real
&block 1.090000 0.080000 1.170000 ( 1.178771)
Proc.new 0.160000 0.000000 0.160000 ( 0.155053)
Mấu chốt ở đây là khi sử dụng &block thì sẽ luôn tạo ra đối tượng Proc mới, nay cả khi chúng ta không cần dùng đến. Bằng cách sử dụng Proc.new khi chúng ta cần đến, chúng ta có thể tránh trả giá về tốc độ của việc khởi tạo toàn bộ các đối tượng.
Tuy thế, có thể bạn sẽ gặp một số vấn đề về phần code dễ đọc vs tốc độ, điều đó được thấy rõ từ hàm somtimes_block chỉ nhận block và do đó được mặc định hiểu sẽ phải làm cái gì đó với cái block đó, nhưng không thể đưa ra cùng nhận định vào hàm tôi ưu sometimes_proc_new.
Kết luận là nó tuỳ thuộc vào yêu cầu, nhưng cũng khá thú vị khi biết được chiêu hữu dụng này của Ruby.
Nguồn tham khảo
- Data Structures as Functions (or, Implementing Set#to_proc and Hash#to_proc in Ruby)
- A Summit for Scaling
- Implementing if in Ruby