وننوه بأن الدراسات الأنثروبولوجية أثبتت أن الإنسان القديم لم يكن بمقدوره أن ينطق أصواتًا منفصلة بعضها عن بعض، لأن البنية التشريحية لأعضاء النطق عنده كانت تمكنه فقط من نطق أصوات مندمجة بعضها ببعض. فإذا أخذنا هذه الحقيقة العلمية بعين الاعتبار، تبين لنا أن الفترة التاريخية التي انفصلت فيها مجموعة الأصوات المندمجة بعضها بعض عن ارتباطها بالانفعال وارتبطت بالأشياء الموجودة في الواقع (أو بشكل أدق برموز تلك الأشياء) كانت تمثل نقطة انعطاف هام باعتبارها بداية تشكل الكلام الإنساني. فقد انتقل الصوت حينئذٍ من كونه وسيلة للتعبير العفوي عن الانفعال وأصبح وسيلة للتعبير الإرادي السمعي. ولعب أشكال ملامح الوجه وإشارات اليد المختلفة دورًا كبيرًا في ذلك الانتقال.
يميز عالم النفس ليف فيجوتسكي مستويين للكلام: المستوى الدلالي المتصل بالمعنى والمستوى الصوتي الخارجي. ويرى أن هذا التمييز لا ينفي الوحدة بينهما، ويؤكد أنها ليست وحدة تجانس وإنما هي وحدة تركيب. ويتحرك هذان المستويان في اتجاهين: فمن ناحية الكلام الخارجي يتقدم الطفل من الجزء إلى الكل، فهو يبدأ بكلمة واحدة ويتجه نحو الجمل. أما من ناحية المعنى، فيسير في الاتجاه المعاكس. فالكلمة الأولى تمثل بالنسبة للطفل جملة كلية، ثم يأخذ في التمكن من الوحدات الدلالية المنفصلة.
يوضح هذا التحليل ضرورة التمييز بين الجانبين الصوتي والدلالي، ويشير إلى أن هذا التمييز هو أساس وحدتهما. فتفكير الطفل الذي يكون في البداية كلًا غير متميز ينبغي أن يجد تعبيرًا في كلمة مفردة. وكلما صار تفكير الطفل أكثر تمايزًا يقل ميله إلى التعبير عنه بكلمات مفردة. ومن ناحية أخرى يساعد التقدم في الكلام إلى الكل المتميز في الجملة أفكار الطفل كي تتقدم من الكل المتجانس إلى أجزاء أكثر تحديدًا.