marc-tonsen · April 11, 2022 07:47
diff --git a/README.md b/README.md
diff --git a/requirements.txt b/requirements.txt
 more_itertools
 pandas
 numpy
 tqdm
 av
 opencv-python
diff --git a/scanpath_visualisation.py b/scanpath_visualisation.py
 import cv2
 import json
 import pathlib
 import tqdm
 import numpy as np
 import pandas as pd
 import sys
 import csv
 import av
 import more_itertools

 recpath = pathlib.Path(sys.argv[1])

 try:
    scene_vid = list(recpath.glob("*.mp4"))[0]
 except Exception:
    raise Exception("could not find scene video file")

 print("Reading gaze data...")
 gaze_stream = more_itertools.peekable(pd.read_csv(recpath / "gaze.csv").to_records())

 print("Reading world timestamps...")
 world_ts = [
    row["timestamp [ns]"]
    for row in pd.read_csv(recpath / "world_timestamps.csv").to_records()
 ]

 _lk_params = dict(
    winSize=(90, 90),
    maxLevel=3,
    criteria=(cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 0.03),
    minEigThreshold=0.005,
 )
 input_container = av.open(str(scene_vid))
 output_container = av.open(str(recpath / "scan_path_visualization.mp4"), "w")


 try:
    output_video = output_container.add_stream("h264_nvenc")
    print("using nvenc encoding")
 except Exception as e:
    print("nvenc not available", e)
    output_video = output_container.add_stream("h264")

 output_video.options["bf"] = "0"
 output_video.options["movflags"] = "faststart"
 output_video.codec_context.height = 1080
 output_video.codec_context.width = 1088
 output_video.codec_context.time_base = input_container.streams.video[0].time_base


 def stream_fixations(recpath):
    fixations_csv = recpath / "fixations.csv"
    if fixations_csv.exists():
        yield from csv.DictReader((recpath / "fixations.csv").open())
    else:
        fixations_json = recpath / "fixations.json"
        if fixations_json.exists():
            for fixation in json.load(fixations_json.open()):
                if fixation["label"] == "fixation":
                    yield {
                        "fixation id": fixation["instance"],
                        "fixation x [px]": fixation["start_x"],
                        "fixation y [px]": fixation["start_y"],
                        "start timestamp [ns]": fixation["start_t"],
                        "end timestamp [ns]": fixation["end_t"],
                        "duration [ms]": (fixation["end_t"] - fixation["start_t"])
                        / 1e6,
                    }


 fixations_stream = more_itertools.peekable(stream_fixations(recpath))

 yellow = (0, 255, 255)
 red = (0, 0, 255)
 green = (0, 255, 0)
 white = (255, 255, 255)
 blue = (255, 0, 0)
 black = (0, 0, 0)
 orange = (0, 122, 255)

 gaze_color = red
 text_color = yellow
 fixation_colors = [orange]
 scan_color = yellow

 prev_img = None
 scanpath = (recpath / "scanpath.json").open("w")
 trail = []
 world_timestamps = zip(world_ts[:-1], world_ts[1:])
 world_frames = zip(world_timestamps, input_container.decode(video=0))

 with output_container:
    for (world_start_ts, world_stop_ts), world_frame in tqdm.tqdm(
        world_frames, unit=" frames", total=len(world_ts) - 1
    ):
        if world_frame.pts is None:
            continue
        world_img = world_frame.to_ndarray(format="bgr24")
        draw_img = world_img.copy()

        while 1:
            try:
                next_gaze = gaze_stream.peek()
            except StopIteration:
                break
            if next_gaze is None or next_gaze["timestamp [ns]"] > world_stop_ts:
                break
            gaze = next(gaze_stream)
            px = gaze["gaze x [px]"]
            py = gaze["gaze y [px]"]
            cv2.circle(draw_img, (int(px), int(py)), 20, gaze_color, 3)

        while 1:
            try:
                next_fixation = fixations_stream.peek()
            except StopIteration:
                break
            if (
                next_fixation is None
                or int(next_fixation["start timestamp [ns]"]) > world_stop_ts
            ):
                break
            fixation = next(fixations_stream)
            trail.append(fixation)

        history_size = int(1e9)
        if prev_img is not None and trail:
            trail = [
                fixation
                for fixation in trail
                if int(fixation["end timestamp [ns]"]) > world_stop_ts - history_size
            ]
            new_points, status, err = cv2.calcOpticalFlowPyrLK(
                prev_img,
                world_img,
                np.array(
                    [
                        (
                            float(fixation["fixation x [px]"]),
                            float(fixation["fixation y [px]"]),
                        )
                        for fixation in trail
                    ]
                )
                .astype(np.float32)
                .reshape(-1, 2),
                None,
                **_lk_params,
            )
            if new_points is not None:
                newtrail = []
                for fixation, ok, point in zip(trail, status, new_points):
                    fixation["fixation x [px]"] = float(point[0])
                    fixation["fixation y [px]"] = float(point[1])
                    if ok:
                        newtrail.append(fixation)
                trail = newtrail

        scanpath.write(
            json.dumps(
                {
                    "ts": int(world_start_ts),
                    "f": [
                        {
                            "x": int(t["fixation x [px]"]),
                            "y": int(t["fixation y [px]"]),
                            "i": t["fixation id"],
                        }
                        for t in trail
                    ],
                }
            )
            + "\n"
        )
        prev_p = None
        for fixation in trail:
            p = int(fixation["fixation x [px]"]), int(fixation["fixation y [px]"])
            if prev_p:
                cv2.line(draw_img, prev_p, p, scan_color, 2)

            size = int(int(fixation["duration [ms]"]) / 250.0 * 20)

            fixation_color = fixation_colors[
                int(fixation["fixation id"]) % len(fixation_colors)
            ]
            cv2.circle(draw_img, p, size, fixation_color, 3)
            plot_point = (p[0] + 20, p[1] - size)
            for color, thickness in [(black, 4), (fixation_color, 2)]:
                cv2.putText(
                    draw_img,
                    str(fixation["fixation id"]),
                    plot_point,
                    cv2.FONT_HERSHEY_SIMPLEX,
                    fontScale=1,
                    thickness=thickness,
                    color=color,
                )

            prev_p = p

        # cv2.imshow("world", draw_img)
        # if cv2.waitKey(1) & 0xFF == ord("q"):
        #     break

        new_frame = world_frame.from_ndarray(draw_img, format="bgr24")
        new_frame.pts = world_frame.pts
        packets = output_video.encode(new_frame)
        output_container.mux(packets)
        prev_img = world_img
	import cv2
	import json
	import pathlib
	import tqdm
	import numpy as np
	import pandas as pd
	import sys
	import csv
	import av
	import more_itertools

	recpath = pathlib.Path(sys.argv[1])

	try:
	scene_vid = list(recpath.glob("*.mp4"))[0]
	except Exception:
	raise Exception("could not find scene video file")

	print("Reading gaze data...")
	gaze_stream = more_itertools.peekable(pd.read_csv(recpath / "gaze.csv").to_records())

	print("Reading world timestamps...")
	world_ts = [
	row["timestamp [ns]"]
	for row in pd.read_csv(recpath / "world_timestamps.csv").to_records()
	]

	_lk_params = dict(
	winSize=(90, 90),
	maxLevel=3,
	criteria=(cv2.TERM_CRITERIA_EPS \| cv2.TERM_CRITERIA_COUNT, 10, 0.03),
	minEigThreshold=0.005,
	)
	input_container = av.open(str(scene_vid))
	output_container = av.open(str(recpath / "scan_path_visualization.mp4"), "w")


	try:
	output_video = output_container.add_stream("h264_nvenc")
	print("using nvenc encoding")
	except Exception as e:
	print("nvenc not available", e)
	output_video = output_container.add_stream("h264")

	output_video.options["bf"] = "0"
	output_video.options["movflags"] = "faststart"
	output_video.codec_context.height = 1080
	output_video.codec_context.width = 1088
	output_video.codec_context.time_base = input_container.streams.video[0].time_base


	def stream_fixations(recpath):
	fixations_csv = recpath / "fixations.csv"
	if fixations_csv.exists():
	yield from csv.DictReader((recpath / "fixations.csv").open())
	else:
	fixations_json = recpath / "fixations.json"
	if fixations_json.exists():
	for fixation in json.load(fixations_json.open()):
	if fixation["label"] == "fixation":
	yield {
	"fixation id": fixation["instance"],
	"fixation x [px]": fixation["start_x"],
	"fixation y [px]": fixation["start_y"],
	"start timestamp [ns]": fixation["start_t"],
	"end timestamp [ns]": fixation["end_t"],
	"duration [ms]": (fixation["end_t"] - fixation["start_t"])
	/ 1e6,
	}


	fixations_stream = more_itertools.peekable(stream_fixations(recpath))

	yellow = (0, 255, 255)
	red = (0, 0, 255)
	green = (0, 255, 0)
	white = (255, 255, 255)
	blue = (255, 0, 0)
	black = (0, 0, 0)
	orange = (0, 122, 255)

	gaze_color = red
	text_color = yellow
	fixation_colors = [orange]
	scan_color = yellow

	prev_img = None
	scanpath = (recpath / "scanpath.json").open("w")
	trail = []
	world_timestamps = zip(world_ts[:-1], world_ts[1:])
	world_frames = zip(world_timestamps, input_container.decode(video=0))

	with output_container:
	for (world_start_ts, world_stop_ts), world_frame in tqdm.tqdm(
	world_frames, unit=" frames", total=len(world_ts) - 1
	):
	if world_frame.pts is None:
	continue
	world_img = world_frame.to_ndarray(format="bgr24")
	draw_img = world_img.copy()

	while 1:
	try:
	next_gaze = gaze_stream.peek()
	except StopIteration:
	break
	if next_gaze is None or next_gaze["timestamp [ns]"] > world_stop_ts:
	break
	gaze = next(gaze_stream)
	px = gaze["gaze x [px]"]
	py = gaze["gaze y [px]"]
	cv2.circle(draw_img, (int(px), int(py)), 20, gaze_color, 3)

	while 1:
	try:
	next_fixation = fixations_stream.peek()
	except StopIteration:
	break
	if (
	next_fixation is None
	or int(next_fixation["start timestamp [ns]"]) > world_stop_ts
	):
	break
	fixation = next(fixations_stream)
	trail.append(fixation)

	history_size = int(1e9)
	if prev_img is not None and trail:
	trail = [
	fixation
	for fixation in trail
	if int(fixation["end timestamp [ns]"]) > world_stop_ts - history_size
	]
	new_points, status, err = cv2.calcOpticalFlowPyrLK(
	prev_img,
	world_img,
	np.array(
	[
	(
	float(fixation["fixation x [px]"]),
	float(fixation["fixation y [px]"]),
	)
	for fixation in trail
	]
	)
	.astype(np.float32)
	.reshape(-1, 2),
	None,
	**_lk_params,
	)
	if new_points is not None:
	newtrail = []
	for fixation, ok, point in zip(trail, status, new_points):
	fixation["fixation x [px]"] = float(point[0])
	fixation["fixation y [px]"] = float(point[1])
	if ok:
	newtrail.append(fixation)
	trail = newtrail

	scanpath.write(
	json.dumps(
	{
	"ts": int(world_start_ts),
	"f": [
	{
	"x": int(t["fixation x [px]"]),
	"y": int(t["fixation y [px]"]),
	"i": t["fixation id"],
	}
	for t in trail
	],
	}
	)
	+ "\n"
	)
	prev_p = None
	for fixation in trail:
	p = int(fixation["fixation x [px]"]), int(fixation["fixation y [px]"])
	if prev_p:
	cv2.line(draw_img, prev_p, p, scan_color, 2)

	size = int(int(fixation["duration [ms]"]) / 250.0 * 20)

	fixation_color = fixation_colors[
	int(fixation["fixation id"]) % len(fixation_colors)
	]
	cv2.circle(draw_img, p, size, fixation_color, 3)
	plot_point = (p[0] + 20, p[1] - size)
	for color, thickness in [(black, 4), (fixation_color, 2)]:
	cv2.putText(
	draw_img,
	str(fixation["fixation id"]),
	plot_point,
	cv2.FONT_HERSHEY_SIMPLEX,
	fontScale=1,
	thickness=thickness,
	color=color,
	)

	prev_p = p

	# cv2.imshow("world", draw_img)
	# if cv2.waitKey(1) & 0xFF == ord("q"):
	# break

	new_frame = world_frame.from_ndarray(draw_img, format="bgr24")
	new_frame.pts = world_frame.pts
	packets = output_video.encode(new_frame)
	output_container.mux(packets)
	prev_img = world_img