Merge branch 'build/datasets-upgrade-s3fs-to-newer-calver' of github.…

…com:MatthiasRoels/kedro-plugins into build/datasets-upgrade-s3fs-to-newer-calver
kedro-org · Nov 30, 2023 · 32e0e31 · 32e0e31
2 parents cf32731 + e5b551d
commit 32e0e31
Show file tree

Hide file tree

Showing 3 changed files with 21 additions and 6 deletions.
diff --git a/Makefile b/Makefile
@@ -1,3 +1,5 @@
+.SUFFIXES:
+
 package:
 	cd $(plugin);\
 	rm -Rf dist;\
@@ -21,10 +23,17 @@ test:
 
 # Run test_tensorflow_model_dataset separately, because these tests are flaky when run as part of the full test-suite
 dataset-tests: dataset-doctests
-	cd kedro-datasets && pytest tests --cov-config pyproject.toml --numprocesses 4 --dist loadfile --ignore tests/tensorflow --ignore tests/databricks --ignore tests/spark
+	cd kedro-datasets && pytest tests --cov-config pyproject.toml --numprocesses 4 --dist loadfile --ignore tests/databricks --ignore tests/tensorflow
 	cd kedro-datasets && pytest tests/tensorflow/test_tensorflow_model_dataset.py  --no-cov
 
-dataset-doctests:
+extra_pytest_args-no-spark=--ignore kedro_datasets/databricks --ignore kedro_datasets/spark
+extra_pytest_args=
+dataset-doctest%:
+	if [ "${*}" != 's-no-spark' ] && [ "${*}" != 's' ]; then \
+	  echo "make: *** No rule to make target \`${@}\`.  Stop."; \
+	  exit 2; \
+	fi; \
+    \
 	# TODO(deepyaman): Fix as many doctests as possible (so that they run).
 	cd kedro-datasets && pytest kedro_datasets --doctest-modules --doctest-continue-on-failure --no-cov \
 	  --ignore kedro_datasets/databricks/managed_table_dataset.py \
@@ -39,7 +48,8 @@ dataset-doctests:
 	  --ignore kedro_datasets/spark/deltatable_dataset.py \
 	  --ignore kedro_datasets/spark/spark_hive_dataset.py \
 	  --ignore kedro_datasets/spark/spark_jdbc_dataset.py \
-	  --ignore kedro_datasets/tensorflow/tensorflow_model_dataset.py
+	  --ignore kedro_datasets/tensorflow/tensorflow_model_dataset.py \
+	  $(extra_pytest_arg${*})
 
 test-sequential:
 	cd $(plugin) && pytest tests --cov-config pyproject.toml
@@ -73,10 +83,10 @@ sign-off:
 	chmod +x .git/hooks/commit-msg
 
 # kedro-datasets related only
-test-no-spark: dataset-doctests
+test-no-spark: dataset-doctests-no-spark
 	cd kedro-datasets && pytest tests --no-cov --ignore tests/spark --ignore tests/databricks --numprocesses 4 --dist loadfile
 
-test-no-spark-sequential: dataset-doctests
+test-no-spark-sequential: dataset-doctests-no-spark
 	cd kedro-datasets && pytest tests --no-cov --ignore tests/spark --ignore tests/databricks
 
 # kedro-datasets/snowflake tests skipped from default scope

diff --git a/kedro-datasets/kedro_datasets/pillow/image_dataset.py b/kedro-datasets/kedro_datasets/pillow/image_dataset.py
@@ -22,8 +22,14 @@ class ImageDataset(AbstractVersionedDataset[Image.Image, Image.Image]):
 
     .. code-block:: pycon
 
+        >>> import sys
+        >>>
+        >>> import pytest
         >>> from kedro_datasets.pillow import ImageDataset
         >>>
+        >>> if sys.platform.startswith("win"):
+        ...     pytest.skip("this doctest hangs on Windows CI runner")
+        ...
         >>> dataset = ImageDataset(filepath="https://storage.googleapis.com/gtv-videos-bucket/sample/images/ForBiggerBlazes.jpg")
         >>> image = dataset.load()
         >>> image.show()

diff --git a/kedro-datasets/kedro_datasets/video/video_dataset.py b/kedro-datasets/kedro_datasets/video/video_dataset.py
@@ -229,7 +229,6 @@ class VideoDataset(AbstractDataset[AbstractVideo, AbstractVideo]):
         ...     filepath="https://storage.googleapis.com/gtv-videos-bucket/sample/ForBiggerBlazes.mp4"
         ... ).load()
         >>> frame = video[0]
-        >>> assert isinstance(np.sum(np.asarray(frame)), np.uint64)
 
 
     Example creating a video from numpy frames using Python API: