hermes-agent/skills/media/songsee/SKILL.md at 49282b6e04ba2b62d7cccfd4e4e0ebd63a17c7a3

mirror of https://github.com/NousResearch/hermes-agent.git synced 2026-04-25 00:51:20 +00:00

kshitijk4poor ccfbf42844 feat: secure skill env setup on load (core #688 )

When a skill declares required_environment_variables in its YAML
frontmatter, missing env vars trigger a secure TUI prompt (identical
to the sudo password widget) when the skill is loaded. Secrets flow
directly to ~/.hermes/.env, never entering LLM context.

Key changes:
- New required_environment_variables frontmatter field for skills
- Secure TUI widget (masked input, 120s timeout)
- Gateway safety: messaging platforms show local setup guidance
- Legacy prerequisites.env_vars normalized into new format
- Remote backend handling: conservative setup_needed=True
- Env var name validation, file permissions hardened to 0o600
- Redact patterns extended for secret-related JSON fields
- 12 existing skills updated with prerequisites declarations
- ~48 new tests covering skip, timeout, gateway, remote backends
- Dynamic panel widget sizing (fixes hardcoded width from original PR)

Cherry-picked from PR #723 by kshitijk4poor, rebased onto current main
with conflict resolution.

Fixes #688

Co-authored-by: kshitijk4poor <kshitijk4poor@users.noreply.github.com>

2026-03-13 03:14:04 -07:00

2.4 KiB

Raw Blame History

name

description

version

author

license

metadata

prerequisites

songsee

Generate spectrograms and audio feature visualizations (mel, chroma, MFCC, tempogram, etc.) from audio files via CLI. Useful for audio analysis, music production debugging, and visual documentation.

1.0.0

community

MIT

hermes

Prerequisites

Requires Go:

go install github.com/steipete/songsee/cmd/songsee@latest

Optional: ffmpeg for formats beyond WAV/MP3.

Quick Start

# Basic spectrogram
songsee track.mp3

# Save to specific file
songsee track.mp3 -o spectrogram.png

# Multi-panel visualization grid
songsee track.mp3 --viz spectrogram,mel,chroma,hpss,selfsim,loudness,tempogram,mfcc,flux

# Time slice (start at 12.5s, 8s duration)
songsee track.mp3 --start 12.5 --duration 8 -o slice.jpg

# From stdin
cat track.mp3 | songsee - --format png -o out.png

Visualization Types

Use --viz with comma-separated values:

Type	Description
`spectrogram`	Standard frequency spectrogram
`mel`	Mel-scaled spectrogram
`chroma`	Pitch class distribution
`hpss`	Harmonic/percussive separation
`selfsim`	Self-similarity matrix
`loudness`	Loudness over time
`tempogram`	Tempo estimation
`mfcc`	Mel-frequency cepstral coefficients
`flux`	Spectral flux (onset detection)

Multiple --viz types render as a grid in a single image.

Common Flags

Flag	Description
`--viz`	Visualization types (comma-separated)
`--style`	Color palette: `classic`, `magma`, `inferno`, `viridis`, `gray`
`--width` / `--height`	Output image dimensions
`--window` / `--hop`	FFT window and hop size
`--min-freq` / `--max-freq`	Frequency range filter
`--start` / `--duration`	Time slice of the audio
`--format`	Output format: `jpg` or `png`
`-o`	Output file path

Notes

WAV and MP3 are decoded natively; other formats require ffmpeg
Output images can be inspected with vision_analyze for automated audio analysis
Useful for comparing audio outputs, debugging synthesis, or documenting audio processing pipelines

2.4 KiB Raw Blame History