catalystneuro · luiztauffer · Oct 23, 2023 · Oct 11, 2023 · Oct 11, 2023 · Oct 13, 2023
diff --git a/.gitignore b/.gitignore
@@ -159,4 +159,5 @@ yarn-error.log*
 # Miscellaneous
 *.fuse_hidden*
 results/
+logs/
 *.nwb
diff --git a/containers/Dockerfile.ks2_5 b/containers/Dockerfile.ks2_5
@@ -1,34 +1,34 @@
 # Spike sorters image
-FROM spikeinterface/kilosort2_5-compiled-base:0.2.0 as ks25base
-
-# NVIDIA-ready Image
-FROM nvidia/cuda:11.6.2-base-ubuntu20.04
-
-# Installing Python with miniconda
-RUN apt-get update && \
-    apt-get install -y build-essential  && \
-    apt-get install -y wget && \
-    apt-get install -y git && \
-    apt-get clean && \
-    rm -rf /var/lib/apt/lists/*
-
-ENV CONDA_DIR /home/miniconda3
-ENV LATEST_CONDA_SCRIPT "Miniconda3-py39_23.5.2-0-Linux-x86_64.sh"
-
-RUN wget --quiet https://repo.anaconda.com/miniconda/$LATEST_CONDA_SCRIPT -O ~/miniconda.sh && \
-    bash ~/miniconda.sh -b -p $CONDA_DIR && \
-    rm ~/miniconda.sh
-ENV PATH=$CONDA_DIR/bin:$PATH
-
-# Bring Sorter and matlab-related files
-COPY --from=ks25base /usr/bin/mlrtapp/ks2_5_compiled /usr/bin/mlrtapp/ks2_5_compiled
-ENV PATH="/usr/bin/mlrtapp:${PATH}"
-COPY --from=ks25base /opt/matlabruntime /opt/matlabruntime
-ENV PATH="/opt/matlabruntime:${PATH}"
-COPY --from=ks25base /usr/lib/x86_64-linux-gnu/libXt.so.6 /usr/lib/x86_64-linux-gnu/libXt.so.6
-COPY --from=ks25base /usr/lib/x86_64-linux-gnu/libSM.so.6 /usr/lib/x86_64-linux-gnu/libSM.so.6
-COPY --from=ks25base /usr/lib/x86_64-linux-gnu/libICE.so.6 /usr/lib/x86_64-linux-gnu/libICE.so.6
-ENV LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/matlabruntime/R2022b/runtime/glnxa64:/opt/matlabruntime/R2022b/bin/glnxa64:/opt/matlabruntime/R2022b/sys/os/glnxa64:/opt/matlabruntime/R2022b/sys/opengl/lib/glnxa64:/opt/matlabruntime/R2022b/extern/bin/glnxa64
+FROM spikeinterface/kilosort2_5-compiled-base:0.2.0
+
+# # NVIDIA-ready Image
+# FROM nvidia/cuda:11.6.2-base-ubuntu20.04
+
+# # Installing Python with miniconda
+# RUN apt-get update && \
+#     apt-get install -y build-essential  && \
+#     apt-get install -y wget && \
+#     apt-get install -y git && \
+#     apt-get clean && \
+#     rm -rf /var/lib/apt/lists/*
+
+# ENV CONDA_DIR /home/miniconda3
+# ENV LATEST_CONDA_SCRIPT "Miniconda3-py39_23.5.2-0-Linux-x86_64.sh"
+
+# RUN wget --quiet https://repo.anaconda.com/miniconda/$LATEST_CONDA_SCRIPT -O ~/miniconda.sh && \
+#     bash ~/miniconda.sh -b -p $CONDA_DIR && \
+#     rm ~/miniconda.sh
+# ENV PATH=$CONDA_DIR/bin:$PATH
+
+# # Bring Sorter and matlab-related files
+# COPY --from=ks25base /usr/bin/mlrtapp/ks2_5_compiled /usr/bin/mlrtapp/ks2_5_compiled
+# ENV PATH="/usr/bin/mlrtapp:${PATH}"
+# COPY --from=ks25base /opt/matlabruntime /opt/matlabruntime
+# ENV PATH="/opt/matlabruntime:${PATH}"
+# COPY --from=ks25base /usr/lib/x86_64-linux-gnu/libXt.so.6 /usr/lib/x86_64-linux-gnu/libXt.so.6
+# COPY --from=ks25base /usr/lib/x86_64-linux-gnu/libSM.so.6 /usr/lib/x86_64-linux-gnu/libSM.so.6
+# COPY --from=ks25base /usr/lib/x86_64-linux-gnu/libICE.so.6 /usr/lib/x86_64-linux-gnu/libICE.so.6
+# ENV LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/opt/matlabruntime/R2022b/runtime/glnxa64:/opt/matlabruntime/R2022b/bin/glnxa64:/opt/matlabruntime/R2022b/sys/os/glnxa64:/opt/matlabruntime/R2022b/sys/opengl/lib/glnxa64:/opt/matlabruntime/R2022b/extern/bin/glnxa64
 
 # Copy requirements and script
 COPY requirements.txt .
@@ -37,11 +37,11 @@ RUN pip install -r requirements.txt
 WORKDIR /app
 COPY main.py .
 COPY utils.py .
-COPY light_server.py .
+# COPY light_server.py .
 RUN mkdir /data
 RUN mkdir /logs
 
 # Get Python stdout logs
 ENV PYTHONUNBUFFERED=1
 
-CMD ["python", "light_server.py"]
+CMD ["python", "main.py"]
diff --git a/containers/README.md b/containers/README.md
@@ -16,7 +16,8 @@ Basic infrastructure makes use of the following AWS services:
 
 Build docker image:
 ```bash
-$ DOCKER_BUILDKIT=1 docker build -t <image-name:version> -f <Dockerfile_name> .
+$ DOCKER_BUILDKIT=1 docker build -t ghcr.io/catalystneuro/si-sorting-ks25:latest -f Dockerfile.ks2_5 .
+$ DOCKER_BUILDKIT=1 docker build -t ghcr.io/catalystneuro/si-sorting-ks3:latest -f Dockerfile.ks3 .
 ```
 
 Run locally:

diff --git a/containers/README_costs.md b/containers/README_costs.md
@@ -5,7 +5,7 @@ ECR:
 - transfer out: $0.09 per GB transferred
 
 S3:
-- storage: $0.023 per GB / mont
+- storage: $0.023 per GB / month
 - requests: $0.005 (PUT, COPY, POST, LIST) or $0.0004 (GET, SELECT)
 - transfer out: 100GB free per month, after that $0.02 per GB (other aws services) or $0.09 per GB (outside of aws)
 

diff --git a/containers/example_formats.py b/containers/example_formats.py
@@ -0,0 +1,154 @@
+
+
+source_data = {
+    "source": "dandi",  # or "s3"
+    "source_data_type": "nwb",  # or "spikeglx"
+    "source_data_paths": {
+        "file": "https://dandiarchive.org/dandiset/000003/0.210813.1807"
+    },
+    "recording_kwargs": {
+        "electrical_series_name": "ElectricalSeries",
+    }
+}
+
+
+source_data_2 = {
+    "source": "s3",
+    "source_data_type": "spikeglx",
+    "source_data_paths": {
+        "file_bin": "s3://bucket/path/to/file.ap.bin",
+        "file_meta": "s3://bucket/path/to/file2.ap.meta",
+    },
+    "recording_kwargs": {}
+}
+
+
+preprocessing_params = dict(
+    preprocessing_strategy="cmr",  # 'destripe' or 'cmr'
+    highpass_filter=dict(freq_min=300.0, margin_ms=5.0),
+    phase_shift=dict(margin_ms=100.0),
+    detect_bad_channels=dict(
+        method="coherence+psd",
+        dead_channel_threshold=-0.5,
+        noisy_channel_threshold=1.0,
+        outside_channel_threshold=-0.3,
+        n_neighbors=11,
+        seed=0,
+    ),
+    remove_out_channels=False,
+    remove_bad_channels=False,
+    max_bad_channel_fraction_to_remove=1.1,
+    common_reference=dict(reference="global", operator="median"),
+    highpass_spatial_filter=dict(
+        n_channel_pad=60,
+        n_channel_taper=None,
+        direction="y",
+        apply_agc=True,
+        agc_window_length_s=0.01,
+        highpass_butter_order=3,
+        highpass_butter_wn=0.01,
+    ),
+)
+
+qm_params = {
+    "presence_ratio": {"bin_duration_s": 60},
+    "snr": {"peak_sign": "neg", "peak_mode": "extremum", "random_chunk_kwargs_dict": None},
+    "isi_violation": {"isi_threshold_ms": 1.5, "min_isi_ms": 0},
+    "rp_violation": {"refractory_period_ms": 1, "censored_period_ms": 0.0},
+    "sliding_rp_violation": {
+        "bin_size_ms": 0.25,
+        "window_size_s": 1,
+        "exclude_ref_period_below_ms": 0.5,
+        "max_ref_period_ms": 10,
+        "contamination_values": None,
+    },
+    "amplitude_cutoff": {
+        "peak_sign": "neg",
+        "num_histogram_bins": 100,
+        "histogram_smoothing_value": 3,
+        "amplitudes_bins_min_ratio": 5,
+    },
+    "amplitude_median": {"peak_sign": "neg"},
+    "nearest_neighbor": {"max_spikes": 10000, "min_spikes": 10, "n_neighbors": 4},
+    "nn_isolation": {"max_spikes": 10000, "min_spikes": 10, "n_neighbors": 4, "n_components": 10, "radius_um": 100},
+    "nn_noise_overlap": {"max_spikes": 10000, "min_spikes": 10, "n_neighbors": 4, "n_components": 10, "radius_um": 100},
+}
+qm_metric_names = [
+    "num_spikes",
+    "firing_rate",
+    "presence_ratio",
+    "snr",
+    "isi_violation",
+    "rp_violation",
+    "sliding_rp_violation",
+    "amplitude_cutoff",
+    "drift",
+    "isolation_distance",
+    "l_ratio",
+    "d_prime",
+]
+
+postprocessing_params = dict(
+    sparsity=dict(method="radius", radius_um=100),
+    waveforms_deduplicate=dict(
+        ms_before=0.5,
+        ms_after=1.5,
+        max_spikes_per_unit=100,
+        return_scaled=False,
+        dtype=None,
+        precompute_template=("average",),
+        use_relative_path=True,
+    ),
+    waveforms=dict(
+        ms_before=3.0,
+        ms_after=4.0,
+        max_spikes_per_unit=500,
+        return_scaled=True,
+        dtype=None,
+        precompute_template=("average", "std"),
+        use_relative_path=True,
+    ),
+    spike_amplitudes=dict(
+        peak_sign="neg",
+        return_scaled=True,
+        outputs="concatenated",
+    ),
+    similarity=dict(method="cosine_similarity"),
+    correlograms=dict(
+        window_ms=100.0,
+        bin_ms=2.0,
+    ),
+    isis=dict(
+        window_ms=100.0,
+        bin_ms=5.0,
+    ),
+    locations=dict(method="monopolar_triangulation"),
+    template_metrics=dict(upsampling_factor=10, sparsity=None),
+    principal_components=dict(n_components=5, mode="by_channel_local", whiten=True),
+    quality_metrics=dict(
+        qm_params=qm_params, 
+        metric_names=qm_metric_names, 
+        n_jobs=1
+    ),
+)
+
+curation_params = dict(
+    duplicate_threshold=0.9,
+    isi_violations_ratio_threshold=0.5,
+    presence_ratio_threshold=0.8,
+    amplitude_cutoff_threshold=0.1,
+)
+
+visualization_params = dict(
+    timeseries=dict(n_snippets_per_segment=2, snippet_duration_s=0.5, skip=False),
+    drift=dict(
+        detection=dict(method="locally_exclusive", peak_sign="neg", detect_threshold=5, exclude_sweep_ms=0.1),
+        localization=dict(ms_before=0.1, ms_after=0.3, local_radius_um=100.0),
+        n_skip=30,
+        alpha=0.15,
+        vmin=-200,
+        vmax=0,
+        cmap="Greys_r",
+        figsize=(10, 10),
+    ),
+)