Databricks Certified Data Engineer Professional Exam - Topic 1 Question 51 Discussion

Question

Databricks Certified Data Engineer Professional Exam - Topic 1 Question 51 Discussion

A junior data engineer has been asked to develop a streaming data pipeline with a grouped aggregation using DataFrame df. The pipeline needs to calculate the average humidity and average temperature for each non-overlapping five-minute interval. Events are recorded once per minute per device.Streaming DataFrame df has the following schema:"device_id INT, event_time TIMESTAMP, temp FLOAT, humidity FLOAT"Code block:Choose the response that correctly fills in the blank within the code block to complete this task.

A) to_interval('event_time', '5 minutes').alias('time')

C) 'event_time'

D) window('event_time', '10 minutes').alias('time')

E) lag('event_time', '10 minutes').alias('time')

Accepted Answer

B) window('event_time', '5 minutes').alias('time')

Databricks Certified Data Engineer Professional Exam - Topic 1 Question 51 Discussion

Databricks Certified Data Engineer Professional Exam - Topic 1 Question 51 Discussion

Contribute your Thoughts: