llama2.cとllama2.cpp

ちょっと、再確認…

llama2.cはC言語でコーディングされたもの、llama.cppはC++でコーディングされたものです。

GGML

GGML/GGUFはGeorgi Gerganovさんによって開発されたML(Machine Leaning)系のC++実装です。 GGはGeorgi Gerganovさんのイニシャルです。

参考URLはつぎです。

https://ggml.ai/

https://github.com/ggerganov/ggml

GGMLの実装はつぎのllama.cppにあたると言ってよいのでしょう。

llama.cpp

https://github.com/ggerganov/llama.cpp

GGUF

GGUFはGGMLから引き継がれたモデルの形式です。

本家、ドキュメントはつぎのURLです。

https://github.com/ggerganov/ggml/blob/master/docs/gguf.md

GGUFのフォーマットについてはHuggingFaceのつぎのURLが見やすいかも。

https://huggingface.co/docs/hub/gguf

llama2.c

こちらはAndrej Karpathyさんによって開発されたLlama2のC言語実装です。

https://github.com/karpathy/llama2.c